智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 李水青

智東西10月16日報道,今天,在FORCE LINK AI創(chuàng)新巡展·武漢站上,火山引擎升級了豆包大模型1.6,原生支持4種思考長度,并發(fā)布豆包大模型1.6 lite、豆包語音合成模型2.0、豆包聲音復刻模型2.0三款模型。

為了平衡企業(yè)在不同場景下對模型效果、時延、成本的不同需求,豆包大模型1.6支持Minimal、Low、Medium、High四種思考長度,火山引擎總裁譚待稱,這是國內(nèi)首個原生支持“分檔調(diào)節(jié)思考長度”的模型。

此外,為了幫助企業(yè)平衡模型效果與成本,火山引擎還發(fā)布“智能模型路由”方案,支持豆包大模型、DeepSeek、Qwen、Kimi等多種主流模型的智能選擇調(diào)用。

豆包團隊透露,以DeepSeek為例,經(jīng)過實測,在效果優(yōu)先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本優(yōu)先模式下,在實現(xiàn)DeepSeek-V3.1相似效果的條件下,模型的綜合成本最高下降超過70%。

火山引擎總裁譚待透露,去年5月發(fā)布至今,豆包大模型的每日Token調(diào)用量達到1200億,今年5月,達到1.6萬億,9月達到30萬億每天,實現(xiàn)了253倍的增長。在企業(yè)市場,根據(jù)IDC的報告,今年上半年火山引擎在中國公有云的這個大模型的服務調(diào)用量上居第一,市場份額達到49.2%。

一、國內(nèi)首個分檔調(diào)節(jié)思考長度模型,低強度模式總Token輸出下降超70%

火山引擎總裁譚待提到,今年AI有三個比較明顯的趨勢,第一是具備多模態(tài)理解能力的深度思考模型不斷,第二是視頻圖像等模型的能力已經(jīng)逐步達到生產(chǎn)級水平,第三是企業(yè)級Agent正逐步走向成熟。

今年6月,豆包推出具有多模態(tài)理解能力的深度思考模型Doubao-Seed-1.6。

綜合來看,Doubao-Seed-1.6實現(xiàn)了開啟思考模型后,模型效果提升31%,但這也增加了推理成本,實時場景下CoT Tokens占總數(shù)出比例超77%,所以有82%的企業(yè)選擇不打開深度思考模式。

基于此,昨天,豆包推出Doubao-Seed-1.6-1015新版本,支持分檔深度思考長度,企業(yè)可以根據(jù)需求在不同場景下選擇相應思考長度。

豆包大模型家族更新!豆包每日Token調(diào)用量達30萬億,大漲253倍

低強度模式下,Doubao-Seed-1.6-1015新版本可以在相同模型效果下,使得總輸出Tokens下降77.5%,深度思考時間下降84.6%。

此外,豆包還發(fā)布了Doubao-Seed-1.6-lite,該模型尺寸更小,效果超越Doubao-Seed-1.5-Pro。0-32K上下文區(qū)間內(nèi),Doubao-Seed-1.6-lite總和成本相比Doubao-Seed-1.5-Pro下降了53%。

豆包大模型家族更新!豆包每日Token調(diào)用量達30萬億,大漲253倍

二、發(fā)布語音合成、聲音復刻新模型,新推智能模型路由方案

在多模態(tài)模型方面,火山引擎此前發(fā)布最新圖像創(chuàng)作模型Seed?Dream?4.0,提升了文生圖、圖生圖、圖生圖能力。一張照片生成對應手辦、一張照片生成手帳等。

豆包語音模型已經(jīng)逐步覆蓋從語音合成到語音識別、聲音復刻、實時語音、同聲傳譯等不同的領(lǐng)域,以智能終端為例,目前豆包語音模型已經(jīng)覆蓋了超過4.6億臺的智能終端。

今天發(fā)布豆包語音合成模型2.0和聲音復刻模型2.0,其采取對話式合成模式,并增強了在情感和演繹指令遵循。語音合成模型針對小學到高中全階段的學科基本對應的公式,合成準確率達到90%以上。

對比傳統(tǒng)的軟件,Agent能端到端處理任務,自主解決更復雜問題,在編程方面,火山引擎不斷開源開源矩陣,其國內(nèi)首個AI原生IDE平臺TRAE和AI Agent開發(fā)平臺扣子已經(jīng)服務了數(shù)百萬開發(fā)者。

豆包大模型家族更新!豆包每日Token調(diào)用量達30萬億,大漲253倍

為了幫助企業(yè)進行智能模型選擇,火山引擎還推出了智能模型路由方案,該方案支持不同的模式,如平衡模式、效果優(yōu)先模式、成本優(yōu)先模式,定好不同模式的目標之后,模型就會根據(jù)對應的請求自動選擇最合適的模型。該平臺支持豆包全系列模型以及DeepSeek、Qwen、Kimi等業(yè)界主流開源模型。

豆包團隊透露,以DeepSeek為例,經(jīng)過實測,在效果優(yōu)先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本優(yōu)先模式下,在實現(xiàn)DeepSeek-V3.1相似效果的條件下,模型的綜合成本最高下降超過70%。

三、將推扣子空間企業(yè)版,滿足企業(yè)個性化定制需求

為了幫助企業(yè)做好AI轉(zhuǎn)型,火山引擎還將Agent和傳統(tǒng)的各種存量系統(tǒng)進行了打通,通過HiAgent平臺,構(gòu)造了一+N+X的體系,幫助企業(yè)打造統(tǒng)一Agent界面,包含1個統(tǒng)一交互入口、N個企業(yè)通用智慧助手以及X個企業(yè)定制智能體應用。

豆包大模型家族更新!豆包每日Token調(diào)用量達30萬億,大漲253倍

2024年,低代碼Agent開發(fā)平臺扣子發(fā)布,其中預置智能客服助手、寫作助手等模版,還會提供插件、可視化界面、數(shù)據(jù)庫等各項功能。

今年4月,火山引擎發(fā)布面向辦公場景的AI Agent產(chǎn)品扣子空間,目前已經(jīng)服務了上百萬知識工作者,包括股票分析師、老師、電商運營等。

接下來,扣子空間計劃推出企業(yè)版,滿足企業(yè)的個性化需求。

其有兩大特點,一是定制化的Agent,企業(yè)可以自定義更加符合自身業(yè)務需求的個性化智能體,二是MCP開發(fā),企業(yè)可以通過API為自己的Agent增加私有化的技能,三是數(shù)據(jù)連接器、企業(yè)知識庫,可以幫助企業(yè)鏈接內(nèi)部數(shù)據(jù),最后是企業(yè)級系統(tǒng)管理,為企業(yè)提供不同權(quán)限管理模式。

結(jié)語:火山引擎正幫企業(yè)進一步掃清落地障礙

火山引擎此次更新凸顯出的關(guān)鍵是,其正在幫助企業(yè)更便捷、快速且在成本可控的程度下用上大模型,豆包大模型1.6版本首創(chuàng)四檔思考長度調(diào)節(jié)功能,實現(xiàn)了模型性能與成本控制的動態(tài)平衡。

此前,Agent的商業(yè)化落地受困于高Token消耗帶來的成本壓力,此次火山引擎的更新為這一瓶頸提出了有效路徑,或許可以加速Agent的規(guī)?;瘧谩?/p>