智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西7月30日報道,今日,火山引擎發(fā)布全新豆包·圖像編輯模型3.0、豆包·同聲傳譯模型2.0,宣布扣子開源版正式上線,全新升級豆包大模型1.6系列,發(fā)布企業(yè)自有模型托管方案、Responses API等多個模型服務(wù)及工具產(chǎn)品,升級HiAgent 2.0、PromptPilot等工具,為企業(yè)和開發(fā)者構(gòu)建Agent、落地AI夯實基礎(chǔ)設(shè)施。

在回顧了近期豆包大模型取得的一系列成績后,火山引擎總裁譚待強調(diào),AI云原生是企業(yè)在AI時代構(gòu)建好Agent的創(chuàng)新發(fā)展的關(guān)鍵?;谶@樣的觀察和思考,火山引擎持續(xù)優(yōu)化AI云原生全棧服務(wù),支撐Agent開發(fā)與落地,幫助企業(yè)開發(fā)者在AI時代更好地發(fā)展。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

一、圖像編輯模型3.0:動嘴P圖時代來了,一句話指哪改哪

火山引擎總裁譚待發(fā)布全新豆包·圖像編輯模型3.0和豆包·同聲傳譯模型2.0。

豆包·圖像編輯模型SeedEdit 3.0顯著優(yōu)化了指令遵循能力、圖像保持能力、圖像生成質(zhì)量,優(yōu)化了“動嘴P圖”的效果和效率,可廣泛應(yīng)用于影像創(chuàng)作、廣告營銷、游戲宣傳等領(lǐng)域。

無論是變成吉卜力風(fēng)格、調(diào)整光影、P掉路人、把線稿變彩圖、替換背景,該模型都能得心應(yīng)手。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

用戶通過自然語言指令,即可完成消除多余內(nèi)容、改變光影效果、替換文字等操作。該模型具備對風(fēng)格、結(jié)構(gòu)與語義的精準(zhǔn)控制力,能夠像人類大腦一樣理解指令、深度思考,解鎖更多創(chuàng)新的修圖場景,例如圖像風(fēng)格轉(zhuǎn)換、變換材質(zhì)、變化人物姿勢、根據(jù)提示詞進行推理等P圖玩法

豆包·圖像編輯模型SeedEdit 3.0基于文生圖模型 Seedream 3.0,疊加多樣化的數(shù)據(jù)融合方法與特定獎勵模型,可支持1K以上高清圖像的生成與處理,在對編輯區(qū)域進行精細(xì)自然調(diào)整的同時,能高度還原并保留圖像主體、背景及細(xì)節(jié)信息。

動動嘴就能精準(zhǔn)P圖的時代,真的來了。

比如你可以要求人物長發(fā)變短發(fā)、改變姿勢坐在椅子上,P圖后背景、人物面部特征等細(xì)節(jié)無損。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

你也可以精準(zhǔn)鎖定其他區(qū)域,比如要求只修改毛衣區(qū)域顏色和紋理并添加項鏈。

豆包·圖像編輯模型3.0只瞄準(zhǔn)文字區(qū)域,字體、光影會自動匹配原圖風(fēng)格,智能填充周圍紋理;還能讓黑夜秒變陽光明媚的白晝,光影自然過渡,建筑、樹木細(xì)節(jié)清晰銳利,毫無涂抹感或分辨率下降。

此外,該模型可以理解“發(fā)酵”過程,生成體積膨大、充滿氣泡的發(fā)酵面團圖。并且基于面團狀態(tài)進行推理,在保持面團主體關(guān)聯(lián)性的前提下,生成金黃酥脆、香氣四溢的面包圖。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

實用玩法很多,比如讓它“去掉所有路人”、“消除文字”、“給黑白照片上色”,或是給照片、設(shè)計換個光影氛圍或風(fēng)格。

企業(yè)用戶可在火山方舟平臺調(diào)用該模型API,個人用戶可使用即夢或豆包App的“豆包P圖”功能體驗。

二、同聲傳譯模型2.0:3秒超低延遲,0樣本聲音復(fù)刻

傳統(tǒng)翻譯系統(tǒng)通常依賴于“級聯(lián)模型”,即多個模塊相互串聯(lián),依次處理語音識別、翻譯、聲音復(fù)刻和語音合成等任務(wù),翻譯結(jié)果不夠連貫、處理速度慢。

豆包·同聲傳譯模型Seed-LiveInterpret 2.0做到“邊聽邊說”,支持全雙工語音理解和生成框架,將傳統(tǒng)機器同傳的語音延遲從8-10秒降低到2-3秒,實現(xiàn)文本與語音的同步生成;無需提前錄制,一邊說話一邊采樣,實現(xiàn)0樣本聲音復(fù)刻,讓同一個人同音色開口說外語,甚至匹配方言口音,大幅提升跨語言溝通沉浸感和效率。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

三、豆包大模型1.6升級:極速版百萬token輸入僅0.15元

豆包大模型1.6系列模型能力升級。Doubao-Seed-1.6-thinking-0715深度思考模型增強代碼、推理和視覺理解能力,Doubao-Seed-1.6-flash-0715模型能力更全、速度更快、價格更低,Seed1.6-embedding模型可構(gòu)建強大的多模態(tài)企業(yè)還是問答,實現(xiàn)全模態(tài)混合檢索和自定義指令增強。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

火山引擎智能算法負(fù)責(zé)人吳迪談道,構(gòu)建AI應(yīng)用有4大挑戰(zhàn):

  • 模型:在業(yè)務(wù)落地中選擇更強的模型;
  • 性能:高質(zhì)量的吞吐和延遲體驗會變得越來越重要;
  • 安全:重中之重是取得更多的客戶信任;
  • 工具:多步驟復(fù)雜任務(wù)和工具使用的能力,會逐漸滲透到廣大企業(yè)的核心業(yè)務(wù)中,為額客戶創(chuàng)造價值。

應(yīng)對這些挑戰(zhàn),豆包大模型和火山方舟以更強的模型、更低的價格、更易落地的方案,助力業(yè)績提升。

極速版Doubao-Seed-1.6-flash模型服務(wù)于對延遲和成本敏感的客戶,具有能力全、速度快、價格低的特點,在保持出色視覺理解能力的同時,升級了代碼、推理、數(shù)學(xué)等大語言模型能力,非常適合智能巡檢、手機助手、智能硬件等對模型效果、速度和成本都有要求的大規(guī)模商業(yè)化場景。

該模型具有業(yè)界領(lǐng)先的極低延遲,每token延遲(TPOT)僅10毫秒,在輸入文本長度0-32k的區(qū)間中(企業(yè)使用量最大),每百萬tokens輸入僅需0.15元,輸出僅1.5元,同時還具備出色的視覺理解能力。

在一個真實的家用安防客戶案例中,Doubao-Seed-1.6-flash幫助客戶將輸出延遲降低60%以上、端到端性能提升50%以上,產(chǎn)品成本降低70%。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

吳迪宣布,Doubao-Seed-Translation多語言文本翻譯大模型正式開源。

豆包最新翻譯模型支持28種語言,打破溝通壁壘,針對法律條文、科技用語、文言文領(lǐng)域的專業(yè)術(shù)語或復(fù)雜文本都能精準(zhǔn)把握語境,提供高質(zhì)量的翻譯。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

火山疫情全模態(tài)向量化模型Seed1.6-Embedding帶來三大突破:全面效果領(lǐng)先,首次實現(xiàn)“文本+圖像+視頻”混合模態(tài)的融合檢索,升級自定義指令能力,讓向量生成能更貼合各類業(yè)務(wù)需求。該模型在權(quán)威測評中包攬多模態(tài)全面任務(wù)及中文文本的最優(yōu)成績,可助力企業(yè)構(gòu)建更強大的多模態(tài)知識庫。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

例如在電商場景,你可以強調(diào)價格與材質(zhì)的相似性;在影視領(lǐng)域,你可以強調(diào)文字劇情與角色的精準(zhǔn)匹配。這使得模型更靈活,更容易被集成到企業(yè)現(xiàn)有業(yè)務(wù)流程中,大幅降低業(yè)務(wù)落地門檻。

目前Seed1.6-Embedding已全面上線火山方舟。

Viking DB是字節(jié)跳動自研的高性能向量數(shù)據(jù)庫,面向全模態(tài)進行多項升級。

一是全介質(zhì)索引升級,從內(nèi)存索引(適合高并發(fā)中等數(shù)據(jù)規(guī)模,億級及以下)、磁盤索引(適合地并發(fā)超大數(shù)據(jù)規(guī)模場景,十億及以上)到GPU索引(超過并發(fā)超大數(shù)據(jù)規(guī)模場景),打通了億級數(shù)據(jù)跨介質(zhì)檢索能力。

二是更高的性價比,在數(shù)億索引數(shù)據(jù)規(guī)模下,相比傳統(tǒng)內(nèi)存方案可將成本降低75%。

三是升級全模態(tài)表征能力,實現(xiàn)更易用的文本、圖像、視頻端到端一鍵向量化。用戶只需抓住原始數(shù)據(jù),系統(tǒng)就能自動完成向量化。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

例如博查致力于提供AI時代的知識搜索創(chuàng)新,服務(wù)了4000多家企業(yè)和2萬多名開發(fā)者,承接著國內(nèi)超過60%的AI應(yīng)用所需的聯(lián)網(wǎng)搜索需求?;鹕揭?span id="et2ofiw" class="">VikingDB協(xié)助博查改善了客戶體驗。

以向量數(shù)據(jù)庫VikingDB為基礎(chǔ),火山引擎還打造了方便易用的升級版知識庫,支持圖文視頻全模態(tài)處理和混排輸出,在國內(nèi)外諸多評測中展現(xiàn)出了更好的效果。

對于很多希望使用火山知識庫的開發(fā)者,火山引擎進一步推出新的標(biāo)準(zhǔn)版,價格僅為旗艦版的1/10。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

四、扣子核心能力開源,在火山引擎可自動化部署

7月26日,火山引擎做出一個重要決定:AI Agent開發(fā)平臺扣子將核心功能開源

本次開源覆蓋扣子平臺最核心的兩個項目: 扣子開發(fā)平臺(Coze Studio)、 扣子羅盤(Coze Loop),并采用沒有任何附加條件的Apache 2.0許可證開源,用戶可在GitHub下載。

扣子開發(fā)平臺是一個一站式AI Agent可視化開發(fā)工具,可快速實現(xiàn)AI Agent的開發(fā)創(chuàng)建、調(diào)試和部署;扣子羅盤是一個聚焦AI Agent的全流程管理系統(tǒng),幫助開發(fā)者實現(xiàn)Agent從開發(fā)到運維的全鏈路管理。

扣子開源版上線受廣受歡迎,開源僅3天,扣子開發(fā)平臺在GitHub上星標(biāo)過萬,扣子羅盤星標(biāo)超過3000。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

HiAgent為扣子開源版提供了全面支持。

企業(yè)AI平臺產(chǎn)品HiAgent可調(diào)用扣子開源版提供的智能體搭建和運維能力,并通過共享Agent標(biāo)準(zhǔn),支持扣子開源版智能體的納管。

火山引擎的云基礎(chǔ)產(chǎn)品也將為扣子開源版提供高效、穩(wěn)定、可靠的基礎(chǔ)設(shè)施支持。開發(fā)者可一鍵拉起資源,完成部署。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

還有一系列優(yōu)惠政策向新用戶提供。

火山引擎AI開源矩陣越來越強大,幫助企業(yè)做好數(shù)據(jù),幫助開發(fā)者更好地構(gòu)建AI應(yīng)用,為AI開源生態(tài)繁榮貢獻力量。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

五、企業(yè)自有模型托管方案發(fā)布,通過火山方舟模型單元部署

針對有模型定制需求的企業(yè)客戶,火山引擎發(fā)布企業(yè)自有模型托管方案。

依托火山方舟模型單元,企業(yè)無需運維底層GPU資源,也不用進行復(fù)雜的網(wǎng)絡(luò)和調(diào)度配置,就能在火山方舟上實現(xiàn)自研模型的全托管,并在推理服務(wù)中享受火山方舟極致的彈性算力資源,大幅降本增效。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

在算力成本上,企業(yè)可自主選擇部署方式、機型,并設(shè)置彈性規(guī)則,更精細(xì)地控制首Token時延、模型吐字延遲,且無需為業(yè)務(wù)低谷期付費,最終實現(xiàn)更高的資源利用效率。

此外,全托管的企業(yè)自有模型,還能享受火山方舟上的全套開發(fā)工具、MCP服務(wù)等生態(tài)配套。

火山方舟模型單元已在火山方舟上開放邀測,可申請體驗。

六、Responses API上線,助攻多模態(tài)Agent高效開發(fā)

多模態(tài)模型統(tǒng)一、多模態(tài)模型API的統(tǒng)一,是當(dāng)前大模型發(fā)展的重要趨勢。

為此,火山方舟平臺升級了API體系,推出Responses API。

該API具備原生上下文管理能力,支持多輪對話的鏈?zhǔn)焦芾?/strong>,可無縫銜接文本、圖像、混合模態(tài)數(shù)據(jù),結(jié)合cache能力后能大幅降低延遲和成本,在很多典型應(yīng)用里,整體成本下降幅度可達80%。

此外,Responses API支持自主選擇調(diào)用工具,用戶發(fā)起單次請求,即可聯(lián)動多個內(nèi)置工具、自定義函數(shù)及多輪模型組合響應(yīng),解決復(fù)雜Agent任務(wù),讓Agent開發(fā)更加省時省力。

例如,搭建一個智能助手Agent,傳統(tǒng)構(gòu)建方法要寫463行代碼,用Responses API僅需60行代碼,開發(fā)時間可以從1-2天縮短到1小時,大幅提升效率。在學(xué)習(xí)陪伴場景,對話式Agent需要兼顧情緒引導(dǎo)、英語陪練、百科問答等多種能力,Responses API在幫助客戶降低延遲的同時,將成本進一步節(jié)約超50%,并讓開發(fā)更簡易。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

七、PromptPilot升級:實現(xiàn)更高效提示詞調(diào)試,從“碰運氣”到“精準(zhǔn)調(diào)控”

寫好提示詞(Prompt)是做好AI應(yīng)用的第一個重要部分。

對提示詞工程有幾個基本判斷:模型越強大,問出好問題帶來的正向價值越大。很多高價值問題沒有標(biāo)準(zhǔn)答案,如何讓模型理解需求、服從產(chǎn)品要求是一個長期存在的重要實踐。提示詞工程本質(zhì)上是一個搜索問題,一切搜索問題長期都將由算法來解決。

實際落地過程中也會遇到一些挑戰(zhàn),比如如何寫出一個高質(zhì)量的Agent、如何提升模型落地效果、怎么定義目標(biāo)、如何快速實現(xiàn)模型+業(yè)務(wù)落地的通路?……

PromptPilot通過引導(dǎo)交互,幫助用戶明確任務(wù)意圖和評估標(biāo)準(zhǔn);實現(xiàn)高效迭代,像積累數(shù)據(jù)一樣積累Case,通過SDK調(diào)用,構(gòu)建Case雷達;回顧整個過程。深度優(yōu)化器融合了先進優(yōu)化技術(shù),模擬人類反思,類比錯誤總結(jié)能力,實現(xiàn)提示詞的全自動優(yōu)化,全流程支持聯(lián)網(wǎng)AI搜索和自定義知識庫,確保信息實時性和專業(yè)性,最后給出可視化報告,通過圖表數(shù)據(jù)比對優(yōu)化前后的效果。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

火山引擎宣布PromptPilot全新升級,將提供更廣泛的模型優(yōu)化能力,支持任意模型的提示與優(yōu)化,并與火山引擎知識庫深度融合,能精準(zhǔn)調(diào)用專業(yè)數(shù)據(jù)庫,幫助模型在垂直領(lǐng)域?qū)崿F(xiàn)更準(zhǔn)確、更可靠的理解和輸出。

多年來,火山引擎在算子、框架和調(diào)度層面,也開展了很多深度優(yōu)化工作。

全棧式大模型訓(xùn)練加速引擎veOmni覆蓋了LLM、VLM等多類模型,在測試中比諸多開源框架訓(xùn)練效率提高50%左右;基于全系自研bit推理框架veFuser,推理效率是行業(yè)平均水平的4倍左右。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

火山引擎的veTurbo解決方案,從模型訓(xùn)練、推理部署到強化學(xué)習(xí)的全生命周期,幫助客戶實現(xiàn)AI應(yīng)用的高效開發(fā)。

八、HiAgent:讓數(shù)字員工“持證上崗”,混合開發(fā)、邊干邊學(xué)

火山引擎副總裁張鑫先分享了企業(yè)員工忙碌的一天會有哪些場景,比如看待辦事項、開各種會、做會議紀(jì)要、分配任務(wù)和掌握進展、審核一堆低級錯誤浪費時間、安排出差事項、寫報告、寫日報和明日工作計劃等。

這暴露了企業(yè)效率的3個瓶頸:大量工時被規(guī)則性任務(wù)消耗,系統(tǒng)來回切換導(dǎo)致上下文中斷,以及信息誤導(dǎo)。這些挑戰(zhàn)制約了決策的效率。

HiAgent作為一個一站式智能體工作臺,希望幫助企業(yè)源源不斷地派遣數(shù)字員工,來拓展人類服務(wù)邊界和認(rèn)知邊界,從而解決上述問題。

張鑫總結(jié)了生產(chǎn)級智能體數(shù)字員工的6個要素:量體裁衣,能調(diào)用企業(yè)內(nèi)部系統(tǒng),支持低代碼與高代碼混合開發(fā),對智能體全生命周期管理,通過數(shù)據(jù)支撐與反饋來幫助數(shù)字員工邊干邊學(xué)變聰明,通過統(tǒng)一入口連接所有數(shù)字員工和企業(yè)系統(tǒng)。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

企業(yè)的戰(zhàn)斗力,不在于單點聰明與否,而是看系統(tǒng)性是否能打。

低代碼開發(fā)在第一階段能幫助1-2人小團隊,通過提示詞、可視化拖拉拽,完成一個智能體雛形的搭建與上線。但當(dāng)這些智能體逐漸走向生產(chǎn)的深水區(qū),弊端和局限性逐漸暴露出來,比如很難做深度復(fù)雜算子的定制、復(fù)雜交互界面及意圖識別的開發(fā),也很難支持多人協(xié)同編輯,更不用說如何深入架構(gòu)層面去保證整個系統(tǒng)的性能調(diào)優(yōu)和高可用設(shè)計。

因為這些弊端,部分團隊開始步入第三階段,又回歸高代碼開發(fā),通過SDK和IDE插件結(jié)合高代碼開發(fā)平臺,直接進行模型調(diào)用、算法撰寫、整體架構(gòu)設(shè)計,這又拉高了智能體開發(fā)的技術(shù)門檻,讓真正懂業(yè)務(wù)的人員無法直接參與。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

HiAgent給出的解決方案,就是混合開發(fā)。

一方面,讓專業(yè)技術(shù)人員可以通過全代碼的方式,設(shè)計高可用、高性能的整體架構(gòu)和定制化算子;另一方面,業(yè)務(wù)人員可在探索階段和后面的運營階段,繼續(xù)通過低代碼的方式去迭代提示詞、公祖留、知識庫等,并將這些能力通過組件嵌入到高代碼的抽象中。

通過這種混合開發(fā)模式,業(yè)務(wù)人員可以繼續(xù)進行快速的想法驗證,并可以為數(shù)字員工打開自動迭代的按鈕,技術(shù)人員可以通過高代碼去解決復(fù)雜的邏輯和深度的性能優(yōu)化。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

解決了開發(fā)問題,下一步就是養(yǎng)成。

就像人類員工一樣,智能體作為數(shù)字員工的上崗過程,也覆蓋從招聘、試用期培訓(xùn)到考核、晉升的流程。

HiAgent推出了Agent Devops,實現(xiàn)數(shù)字員工全生命周期管理,覆蓋策略規(guī)劃、能力開發(fā)、效果評測、品質(zhì)優(yōu)化、線上觀測、應(yīng)用發(fā)布等環(huán)節(jié)。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

HiAgent還發(fā)布了數(shù)據(jù)流轉(zhuǎn)模塊,把數(shù)字員工產(chǎn)生的數(shù)據(jù)自動記錄到一個學(xué)習(xí)庫中,再通過數(shù)據(jù)清洗分析和回流沉淀成后續(xù)的評測集和模型的訓(xùn)練集,變成數(shù)字員工的寶貴經(jīng)驗。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

通過Agent Devops和數(shù)據(jù)流轉(zhuǎn)模塊,越來越多的數(shù)字員工可以從實習(xí)生轉(zhuǎn)正,開始持證上崗了。這時數(shù)字員工好不好用,入口是關(guān)鍵。

HiAgent發(fā)布人機協(xié)同工作臺,打造真人與數(shù)字員工的“統(tǒng)一交互入口”,讓用戶找數(shù)字員工比找真人同事還方便。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

HiAgent數(shù)字員工交互入口根據(jù)不同員工/智能角色的需求,提供千人千面、可自定義的工作畫布形態(tài),在一個畫布中就能連接所有業(yè)務(wù)系統(tǒng)完成日常工作,并通過更靈活的多人協(xié)作人機協(xié)作模式,提升團隊的生產(chǎn)力。

從用戶旅程視角來看,HiAgent 2.0幫助企業(yè)構(gòu)建自己的AI“數(shù)字員工派遣站”流程如下:

  • 企業(yè)個性化需求:企業(yè)會梳理個性化需求,可從行業(yè)里預(yù)制的上百種應(yīng)用樣板間和MCP市場里選擇適合的模版與工具;
  • 數(shù)字員工養(yǎng)成:通過業(yè)務(wù)人員和技術(shù)人員的協(xié)同迭代整合開發(fā),完成數(shù)字員工Agent搭建;
  • 派遣上崗:在經(jīng)過評測、調(diào)優(yōu)、發(fā)布后,數(shù)字員工可以作為一個職場新人開始上崗;
  • 人機協(xié)同:數(shù)字員工通過人機協(xié)同工作臺和真人員工在各種日常業(yè)務(wù)流程中做不同的協(xié)同;
  • 實踐成長:再通過全鏈路的觀測、數(shù)據(jù)支撐、數(shù)據(jù)回流,讓數(shù)據(jù)員工在實踐中不斷成長,從一個職場新人進化成一個業(yè)務(wù)專家。

2025年是智能體成為企業(yè)“數(shù)字同事”、“持證上崗”的元年。作為企業(yè)的AI“數(shù)字員工派遣站”,HiAgent已幫助各式智能體在千行百業(yè)里“持證上崗”,落地汽車維修、招生咨詢、投研顧問、客服導(dǎo)購等領(lǐng)域。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

結(jié)語:火山引擎的AI“朋友圈”愈發(fā)多元,加速Agent開發(fā)落地

今日的一系列發(fā)布與升級,進一步完善了火山引擎AI生態(tài)布局?;鹕揭嬉呀?jīng)為企業(yè)與開發(fā)者提供了從基礎(chǔ)模型到開發(fā)工具的全鏈條支持,加速AI在各行業(yè)的落地應(yīng)用。

越來越多企業(yè)正嘗試火山引擎AI原生的各種產(chǎn)品。

豆包最強AI修圖模型來了!動嘴就能精準(zhǔn)P圖,扣子開源版上線,還搞定同聲傳譯

例如,金山辦公結(jié)合豆包大模型1.6助力AI助手靈犀升級,打造一款原生的Office辦公智能體,使其AI搜索、AI寫作等功能有更好的表現(xiàn),綜合成本還下降了63%,目前金山辦公WPS的豆包1.6使用量已突破日均100億的客戶服務(wù)。

豆包大模型1.6 Flash擁有超低延時,適用于智能巡檢、手機助手、智能硬件等對模型效果、速度和成本都要求非常高的商業(yè)產(chǎn)品。螢石第一時間選擇接入豆包大模型1.6 Flash,實現(xiàn)降本增效,相比之前實用的模型,延時縮短一半,使用成本暴降92.3%。

國內(nèi)知名電商數(shù)字營銷服務(wù)商蟬媽媽利用豆包·視頻生成模型,打造了新一代數(shù)字視頻生成平臺,用于企業(yè)營銷與創(chuàng)意內(nèi)容生產(chǎn),相比之前的視頻生成模型,在商品的主圖生成效果、真實感和視頻可用性方面都帶來明顯提升,節(jié)省超過30%的使用成本。強媽媽每天通過豆包大模型生成的視頻數(shù)量已經(jīng)達到數(shù)千條,很快將突破日均萬條。

在智能電視場景,酷開整合了豆包大模型能力,用一句臺詞或一段劇情準(zhǔn)確鎖定心儀的影片片段,類似的能力還應(yīng)用在教育健康產(chǎn)品中。

在游戲場景,巨人網(wǎng)絡(luò)將豆包大模型應(yīng)用在游戲核心玩法中,依托豆包模型的角色扮演和深度思考能力,游戲中的AI角色既能與玩家對話,又具備極強的邏輯推演能力,能夠制定出縝密而有趣的游戲策略,打破傳統(tǒng)人機交互死板與套路的模式。未來巨人網(wǎng)絡(luò)和火山引擎將進一步深度挖掘豆包大模型的潛力,圍繞智能NPC的創(chuàng)新展開探索。

火山引擎還在不斷迭代模型能力,為企業(yè)帶來能力更強、性價比更高的模型以及更加好用的服務(wù)與工具,加速讓AI Agent走向生產(chǎn)與落地。