智東西(公眾號:zhidxcom)
作者 |? 陳駿達
編輯 |? 漠影

首款豆包編程模型,來了!

智東西11月11日報道,今天,字節(jié)跳動旗下云和AI服務(wù)平臺火山引擎,發(fā)布了豆包大模型家族中的首款編程模型——Doubao-Seed-Code。這是一款專門面向Agentic Coding任務(wù)優(yōu)化的編程模型,并在性價比上實現(xiàn)了突破。

性能方面,在業(yè)內(nèi)多個主流編程測評集中,Doubao-Seed-Code的得分超過了DeepSeek-V3.1、Kimi-K2、GLM-4.6等國產(chǎn)模型,整體表現(xiàn)僅次于當(dāng)前AI編程領(lǐng)域的頂級模型——Claude Sonnet 4.5。此外,Doubao-Seed-Code擁有原生256K上下文,比Claude Sonnet 4.5的200K上下文還要高。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

榜單之外,Doubao-Seed-Code還注重在真實編程場景的落地。得益于其專門面向主流開發(fā)工具的優(yōu)化,無論是Claude Code、Trae還是veCLI的用戶,都能輕松上手,并獲得穩(wěn)定的輸出效果。

同時,Doubao-Seed-Code是國內(nèi)首個支持視覺理解能力的編程模型,它可參照UI設(shè)計稿、截圖或手繪草圖生成代碼,或?qū)ι身撁孢M行視覺比對,自主完成樣式修復(fù)和Bug修復(fù),大幅提升前端開發(fā)效率。

值得一提的是,今天,字節(jié)跳動旗下的AI原生IDE產(chǎn)品Trae中國版已經(jīng)接入了Doubao-Seed-Code模型,Trae+Doubao-Seed-Code的組合,在權(quán)威編程基準(zhǔn)測試SWE-Bench-Verified中一同登頂SOTA,實現(xiàn)模型+工具的生態(tài)閉環(huán)。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

結(jié)合價格后,Doubao-Seed-Code變得更能打了。這一模型采用了分層定價模式,在用戶使用最多的0-32K輸入?yún)^(qū)間上,Doubao-Seed-Code的輸入價格為1.20元/百萬Tokens,輸出價格8.00元/百萬Tokens。使用全量透明緩存后,模型的使用成本還能再降低80%,綜合使用成本降低62.7%。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

我們在實測時讓Doubao-Seed-Code復(fù)刻了經(jīng)典游戲《我的世界》,成本不到2毛錢,畫風(fēng)、游戲體驗上都與原版相似,直接可玩。相同tokens量下(0-32k區(qū)間),Claude Sonnet 4.5完成任務(wù)的成本已經(jīng)超過3元。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

近日,智東西搶先深度體驗了Doubao-Seed-Code在真實編程場景里的效用,它不僅能自主規(guī)劃開發(fā)計劃、快速搭建前端網(wǎng)頁,還能深入數(shù)據(jù)庫進行修改,遇到錯誤時主動修復(fù)、補充注釋、優(yōu)化結(jié)構(gòu)。到這一刻,Doubao-Seed-Code不再只是“寫代碼的機器”,而是一個能與人并肩思考、共同創(chuàng)造的開發(fā)伙伴。

一、無縫接入Claude Code,一張截圖就能復(fù)刻“抖音”

工具兼容性一直是影響AI編程模型采用的主要因素之一,這次,Doubao-Seed-Code在工具的適配上下足了功夫。Doubao-Seed-Code選擇了原生兼容Anthropic API,無需經(jīng)過任何轉(zhuǎn)換即可直接Claude Code。這意味著廣大熟悉Claude Code的開發(fā)者,幾乎可以不費任何學(xué)習(xí)成本地將API輕松切換到Doubao-Seed-Code。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

火山方舟平臺還為Doubao-Seed-Code提供了詳細(xì)的API調(diào)用指南,純小白用戶只需跟著指南一步一步走,就能體驗到新模型。

在深度實測Doubao-Seed-Code的開發(fā)能力之前,我們先來幾道“開胃菜”。

小球彈跳幾乎已經(jīng)成了大模型的必考題。Doubao-Seed-Code打造的小球彈跳不僅符合物理規(guī)律,還十分絲滑。同時,模型自主決定新增了一個功能,只要點擊小球就可以改變其受力情況,讓小球彈跳不再只是無限循環(huán)。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

我們還測試了模型按照網(wǎng)頁截圖開發(fā)的能力。在上傳截圖后,Doubao-Seed-Code可以分析頁面布局、視覺特點等,然后逐步搭建網(wǎng)頁的核心組件。將結(jié)果發(fā)送給用戶前,模型還會進行功能測試,然后再交付成品。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

在日常應(yīng)用場景中,使用Doubao-Seed-Code 開發(fā)小工具同樣快捷高效。我們嘗試輸入“生成一個寵物日記 App”,模型便自動搭建App框架、設(shè)計組件。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

僅需幾分鐘,模型便交付了可直接使用的成品。從登錄界面到圖像、文字的上傳,都能正常運轉(zhuǎn)。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

在開發(fā)過程中,我們觀察到 Doubao-Seed-Code 遵循“先規(guī)劃,再開發(fā)”的邏輯,并利用深度思考能力對生成結(jié)果進行自我分析與優(yōu)化。當(dāng)用戶需求不夠明朗時,模型還能主動梳理需求,甚至提出問題以獲取更多信息。

這些特性,成為Doubao-Seed-Code在真實生產(chǎn)環(huán)境中部署的重要基礎(chǔ)。

二、前后端代碼都能寫,超大上下文可改生產(chǎn)級代碼庫

實際上,Doubao-Seed-Code的能力遠(yuǎn)不止于打造有趣的小程序或網(wǎng)頁,它完全可以勝任復(fù)雜的一線開發(fā)任務(wù)。

為了打造更貼合真實使用需求的網(wǎng)站,開發(fā)者通常會在提示詞中事無巨細(xì)地說明設(shè)計細(xì)節(jié)、交互邏輯乃至技術(shù)約束。這種“精細(xì)化指令”對模型提出了更高要求:是否真正理解用戶意圖、能否在復(fù)雜任務(wù)中穩(wěn)定執(zhí)行,成為檢驗?zāi)P蛯嵙Φ年P(guān)鍵。

在實測中,我們向Doubao-Seed-Code一次性發(fā)送了超長提示詞,希望模型打造一個開源項目分享網(wǎng)站的原型。提示詞中明確規(guī)定了頂部導(dǎo)航欄、主題展示區(qū)、篩選工具等具體組件,還對設(shè)計風(fēng)格提出了詳細(xì)要求。

模型不僅準(zhǔn)確還原了提示詞中的設(shè)計,還生成了可直接交互的前端頁面,頁面布局清晰、交互邏輯合理,整體風(fēng)格與要求中的“科技感”高度契合。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

除了原型開發(fā),找Bug也是編程模型的另一大用途。然而,在生產(chǎn)環(huán)境中真正放手讓大模型修改代碼,仍然存在引入新錯誤、邏輯偏差或安全漏洞的風(fēng)險。

令人驚喜的是,Doubao-Seed-Code不僅擁有原生256K上下文,可在大型代碼庫中搜索解決Bug,還展現(xiàn)出了不錯的復(fù)雜代碼修復(fù)能力和操作規(guī)范意識。

我們將一個人為編寫,含有Bug的Python文件及相關(guān)文件夾交給Doubao-Seed-Code處理。它首先能夠精確的定位問題,注意到各種報錯和風(fēng)險。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

▲Doubao-Seed-Code在Claude Code中修復(fù)代碼

修復(fù)代碼時,Doubao-Seed-Code采取的策略是分步驟、增量式的——它每次修改后都會立即驗證,確保改動落地。

更難能可貴的是,Doubao-Seed-Code并不僅僅局限于語法修復(fù),它能理解程序的邏輯和業(yè)務(wù)需求,主動改進異常處理和輸入驗證,使程序更加安全、可靠。通過持續(xù)的自我檢查與迭代,它能夠發(fā)現(xiàn)之前修復(fù)留下的潛在問題,并進行進一步優(yōu)化。

挑戰(zhàn)完前端設(shè)計和Bug修復(fù),我們還嘗試讓Doubao-Seed-Code深入后端數(shù)據(jù)庫——這將進一步挑戰(zhàn)模型的能力邊界。

數(shù)據(jù)庫表、字段、關(guān)系和約束規(guī)則相比前端頁面元素更加抽象,模型需要理解不同字段之間的依賴和作用。在設(shè)計數(shù)據(jù)庫操作時,如何保證數(shù)據(jù)一致性、避免沖突和冗余,是一項考驗?zāi)P屯评砟芰Φ奶魬?zhàn)。

此時,Doubao-Seed-Code的規(guī)劃能力派上了大用場,能看到它打造的系統(tǒng)結(jié)構(gòu)清晰,符合真實生產(chǎn)場景對可擴展性和安全性的要求。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

當(dāng)然,在這種復(fù)雜任務(wù)下,Doubao-Seed-Code也難以一次完成全部工作。當(dāng)出現(xiàn)各類Bug時,我們只需將相關(guān)代碼、報錯信息提供給模型,再輔以簡單描述,模型就能進行進一步修改,最終迭代出可用的數(shù)據(jù)庫系統(tǒng)。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

我們還能以同樣的方式,在現(xiàn)有基礎(chǔ)上新增復(fù)雜功能,例如權(quán)限管理等。這些功能疊加后,已經(jīng)可以滿足部分生產(chǎn)環(huán)境的實際需求。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

三、起底豆包編程模型訓(xùn)練配方:純強化學(xué)習(xí)煉出SOTA模型

這樣一款在真實生產(chǎn)場景也十分能打的編程模型,究竟是如何煉成的呢?火山引擎表示,為了訓(xùn)練Doubao-Seed-Code,他們打造了一個大規(guī)模的Agent強化學(xué)習(xí)訓(xùn)練系統(tǒng)。

數(shù)據(jù)是智能的重要來源。Doubao-Seed-Code在訓(xùn)練過程中使用了覆蓋10萬容器鏡像的龐大訓(xùn)練數(shù)據(jù)集,并提供端到端沙盒環(huán)境進行評測,確保模型能應(yīng)對多樣化、復(fù)雜的編程場景。

而模型的訓(xùn)練系統(tǒng)具備萬級并發(fā)沙盒session能力,依托千卡GPU集群實現(xiàn)超大規(guī)模并行訓(xùn)練,使模型能夠在高負(fù)載下穩(wěn)定學(xué)習(xí)。

通過強化學(xué)習(xí)優(yōu)化,Doubao-Seed-Code直接從任務(wù)沙盒反饋中學(xué)習(xí),基于這套系統(tǒng),模型無需蒸餾或標(biāo)注的冷啟動數(shù)據(jù),訓(xùn)練路徑簡潔高效。

下游指標(biāo)顯示,模型在Multi-SWE-Bench 和SWE-Bench-Verified數(shù)據(jù)集上表現(xiàn)出色,呈現(xiàn)穩(wěn)定上升趨勢,展現(xiàn)出泛化能力。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

在SWE-Bench基準(zhǔn)測試中,Doubao-Seed-Code僅依靠強化學(xué)習(xí)訓(xùn)練即可實現(xiàn)SOTA級別的性能,驗證了純強化學(xué)習(xí)在真實軟件工程場景下的潛力。

除了強化學(xué)習(xí)訓(xùn)練過程中的設(shè)計,火山引擎還為Doubao-Seed-Code配備了全量透明緩存能力,上下文緩存可在多輪對話場景中減少重復(fù)計算,大幅提升交互效率與響應(yīng)速度。

配合Doubao-Seed-Code的發(fā)布,火山引擎同步發(fā)布了Coding Plan。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

與海外大模型動輒數(shù)百美元的價格相比,方舟Coding Plan展現(xiàn)出較強的性價比。Lite套餐適合大多數(shù)開發(fā)者,可支持中等強度的開發(fā)任務(wù),首購首月價格僅為9.9元,而復(fù)雜項目開發(fā)則可以選擇Pro套餐,首購首月價格為49.9元。

不怕Claude斷供!豆包編程模型來了,5分鐘造“我的世界”翻版,花費2毛錢

用戶可在Claude Code、veCLI、Cursor、Cline、Codex CLI等主流智能編程環(huán)境中使用這一Coding Plan?;鹕揭娴馁Y源池能滿足多用戶并行、復(fù)雜任務(wù)場景下的穩(wěn)定響應(yīng)和輸出,這意味著企業(yè)級用戶也可以放心地大規(guī)模調(diào)用Doubao-Seed-Code等模型,并獲得較為可靠的使用體驗。

結(jié)語:國產(chǎn)編程模型,走到關(guān)鍵機遇期

近幾個月以來,有不少海外AI編程模型面臨斷供風(fēng)險,這對依賴高性能AI工具的開發(fā)者和企業(yè)來說,是不小的挑戰(zhàn)。

像Doubao-Seed-Code這樣的國產(chǎn)編程模型的崛起,正迅速填補這一空白,為開發(fā)者提供穩(wěn)定可控的替代方案。隨著國產(chǎn)模型在性能和兼容性等方面的不斷優(yōu)化,其在國內(nèi)開發(fā)生態(tài)中的影響力和應(yīng)用潛力也將日益凸顯,為企業(yè)和開發(fā)者帶來更加穩(wěn)健的選擇。