??頭圖由AI生成

智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 漠影

智東西1月26日報道,今日,訊飛星辰智能體平臺官宣重大升級,實現(xiàn)了訊飛星辰智能體平臺和AIUI平臺完全打通、升級超擬人交互技術、支持快速定制音色、RPA升級,提供一套全面且完整的多模交互解決方案,讓智能體擁有更全面的類人化交互能力、全場景執(zhí)行能力。

其中最直觀的一個例子就是,將為智能體定制聲音的時間壓縮到了幾秒鐘。發(fā)布會的實際演示中,操作人員在訊飛星辰智能體平臺生成了曹操人格的智能體后,通過自然語言描述想要的音色聲線、輸入試聽文本、點擊生成,就在幾秒內(nèi)合成4個候選音色。接著選擇保存、應用音色后,用戶就能與剛剛的曹操人格智能體進行語音聊天。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

這是訊飛星辰智能體平臺此次升級的一個縮影,而智能體的未來形態(tài),將從單一工具,升級為兼具感知、交互能力,擁有專屬聲音、形象與性格人設,還能自主完成操作執(zhí)行的全能型智能體,驅(qū)動這一切進化的核心,正是多模交互技術

當前海內(nèi)外大廠與科創(chuàng)企業(yè)均在智能體平臺賽道加速布局、密集發(fā)力,但行業(yè)仍普遍面臨技術落地難、場景適配不深的核心痛點。

訊飛星辰智能體平臺此次實現(xiàn)感知、交互、執(zhí)行三大核心能力的一體化整合,從底層打破智能體落地過程中的技術協(xié)同壁壘,直面其場景適配難題,為智能體技術的規(guī)?;涞貟咔尻P鍵障礙。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

簡言之,訊飛星辰智能體平臺此次升級,核心便是瞄準降低智能體開發(fā)門檻、豐富其可落地的能力邊界兩大核心目標,在擴展服務能力的基礎上,還提供了低代碼、一鍵接入、快速接入等快速開發(fā)部署工具。

總的來看,當前智能體產(chǎn)業(yè)技術成熟度足夠支撐場景落地,市場需求旺盛,但落地效率與成本仍是核心瓶頸,而打通場景適配、能力集成、生態(tài)協(xié)同的全棧能力,將成為智能體產(chǎn)業(yè)競爭的核心壁壘。

一、決勝智能體落地,全棧平臺需具備三大核心能力

智能體邁入大規(guī)模落地階段,其正接棒大模型成為下一個最具潛力的爆發(fā)風口。

打通智能體高效落地的關鍵,既要解決技術落地的場景適配問題,還需要同時滿足用戶對高效、自然、個性化智能服務的需求,這也是智能體產(chǎn)業(yè)競爭的核心壁壘。

這背后,離不開智能體平臺的全棧能力支撐。

智能體展現(xiàn)出更多元、自然的交互形態(tài),而唯有具備這類更貼合人類習慣的自然交互能力,才能使其真正融入工作與生活場景,真正實現(xiàn)從工具到協(xié)作伙伴的升級。

正因如此,智能體還需構建起自動執(zhí)行能力,這也是其區(qū)別于傳統(tǒng)系統(tǒng)的關鍵特征。這種感知、決策、運動、執(zhí)行的閉環(huán)能力,讓智能體具備獨立完成端到端復雜任務的能力。

最后當智能體深入千行百業(yè),不同領域?qū)ζ淠芰吔绲囊笠泊嬖陲@著差異。智能體平臺必須支持智能體的角色與能力定制,精準匹配不同領域的專屬要求,同時配備完善的音色、形象個性化選擇功能。

但從當前行業(yè)現(xiàn)狀來看,能夠同時集成超擬人交互、角色定制、自動執(zhí)行三大核心能力的智能體平臺仍屬少數(shù),這背后是技術復雜度高、場景適配成本高、生態(tài)協(xié)同難度大三重壁壘的疊加制約。

技術平臺上的全棧能力并非簡單拼接,而是需要感知、決策、執(zhí)行、交互四大模塊無縫協(xié)同;在實際應用中,碎片化的需求和技術規(guī)?;涞刂g的矛盾,會使得平臺適配成本居高不下,難以大規(guī)模落地;一個完整的智能體平臺,需要硬件供應商、算法開發(fā)商、數(shù)據(jù)服務商和場景方協(xié)同配合,形成清晰的分工體系。

也正因如此,兼具全棧技術能力的智能體平臺打造難度頗高,而這恰恰是當前行業(yè)的核心短板。

二、擬人交互、自動執(zhí)行、定制人設,解鎖智能體多維協(xié)同潛力

訊飛星辰智能體平臺就是圍繞著上述痛點,打破模態(tài)壁壘,實現(xiàn)多維能力協(xié)同。

此次其升級的一大重點是與用戶緊密相關的交互層面,讓其搭載效果更好的語音交互和運動軌跡能力,這同樣是智能體平臺的能力基礎。

一般而言,語音智能體的應用場景往往是問答、搜索、閑聊等純對話方式,而想要疊加動作編排、軌跡規(guī)劃的智能體就需要更為復雜的開發(fā)部署工作。針對這一痛點,訊飛星辰智能體平臺實現(xiàn)了和訊飛人機交互開發(fā)平臺AIUI的完全打通。

這兩大平臺結合的意義在于,為開發(fā)者降本增效以及拓寬應用場景,一方面能快速打通復雜智能體和語音交互,使得語音交互過程中調(diào)用智能體更快,隨后讓機器人進行動作規(guī)劃整個過程一氣呵成;另一方面開發(fā)者可以在自己的應用上開發(fā)復雜智能體,然后快速集成、試用。

結合發(fā)布會上的演示可以看到,當開發(fā)者在兩個平臺上登錄同一賬號,就可以在訊飛星辰智能體平臺上快速創(chuàng)建智能體并直接發(fā)布到AIUI開放平臺。與此同時,其就能為AIUI上創(chuàng)建的桌面機器人等產(chǎn)品快速添加繪本生成等智能體。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

桌面機器人搭載了繪本生成智能體,根據(jù)《望廬山瀑布》的詩句內(nèi)容在幾秒鐘內(nèi)就生成了圖文、聲音結合的繪本。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

其次是讓數(shù)字人從擬人到類人邁出的一大步,訊飛星辰智能體平臺上多模態(tài)超擬人交互的升級。

為了貼合真實場景的用戶交互形式,多模態(tài)超擬人交互從兩個角度下功夫,增強了一句話聲音復刻一張照片構建數(shù)字分身能力。

在一句話聲音復刻能力方面,其能幫助用戶快速構建自己的個人音庫,同時支持中英日韓粵等多種語言、方言合成以及繪本、新聞、交談等多風格場景音色生成;一張照片就可以快速構建數(shù)字分身,大模型能力,口型、表情、動作是大模型自動生成,可以精準匹配用戶意圖。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

這類多維度協(xié)同共生的交互體系,更貼合人與人的自然交流。例如在智慧大廳,數(shù)字人前臺通過多模態(tài)視覺理解,可以實時融合語音、人臉、環(huán)境等多模態(tài)信息,實現(xiàn)自動感知與主動迎賓,并且還能通過自然手勢和類人舉止反饋,擔任智能導覽顧問,并在理解復雜問題的基礎上靈活調(diào)用數(shù)據(jù)和知識,引導用戶辦理相關業(yè)務。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

值得一提的是,這樣的技術升級已經(jīng)轉(zhuǎn)化為企業(yè)可以量化的核心指標,如讓企業(yè)降低門檻構建企業(yè)的專屬數(shù)字形象代言人,多語言多方言合成能力進行全球化業(yè)務拓展等。

但僅靠形象、聲音等外在表現(xiàn)仍然不夠,智能體還需要在長期使用過程中,沉淀出穩(wěn)定且鮮明的性格屬性。

尤其在長期陪伴、用戶高頻交互的場景中,以及強內(nèi)容創(chuàng)作、泛娛樂類的角色扮演應用里,智能體是搭建用戶情感聯(lián)結的核心載體。這就要求其能依據(jù)自身不同狀態(tài)、情緒變化與場景需求,定制適配的音色表達,并生成貼合角色特質(zhì)的內(nèi)容輸出,讓情感互動更具真實感與專屬感。

實際演示中,用戶在訊飛星辰智能體平臺生成了曹操人格的智能體后,就可以通過自然語言描述曹操的聲線,然后點擊生成、試聽文本在幾秒內(nèi)合成4個候選音色。保存、應用音色后,用戶就能與剛剛的曹操人格Agent進行語音聊天。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

同一個角色的聲音在不同年齡段也有不同,用戶只需要調(diào)整對應的描述就可以創(chuàng)造青年版的曹操聲線。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

逼真的數(shù)字人形象、自然的音色、符合人設的生成內(nèi)容,就能讓智能體作為多模交互的“情感與形象載體”。這也使得智能體進一步跳出冰冷的技術工具屬性,通過具象化的情感表達、場景化的形象塑造,實現(xiàn)對用戶狀態(tài)的精準感知與主動交互,讓人機協(xié)作更具溫度。

最后是讓智能體真正執(zhí)行、落地,將交互指令轉(zhuǎn)化為實際行動的關鍵一步。RPA數(shù)字員工可以操控不同的應用軟件,為智能體帶來執(zhí)行能力,這就相當于智能體執(zhí)行的“手腳”。

這之中的兩大升級對應的智能體當下的高頻場景。

目前智能體應用的場景大多為網(wǎng)頁自動化,因此訊飛星辰智能體平臺升級了智能組件,可以幫助開發(fā)者快速配置參數(shù),讓企業(yè)內(nèi)部不具備專業(yè)編程能力的運營人員也可以快速進行編排;企業(yè)內(nèi)部自動化流程的開發(fā)業(yè)務,會涉及大量數(shù)據(jù)處理任務,其完全開源的數(shù)據(jù)表格功能基于可視化的數(shù)據(jù)處理方式,將數(shù)據(jù)處理過程變得透明、可調(diào)適。

可以看到在實際操作中,用戶輸入指令需求,智能組件助手就可以在目標網(wǎng)頁進行數(shù)據(jù)提取,通過打開瀏覽器的網(wǎng)頁、在網(wǎng)頁篩選數(shù)據(jù)、在數(shù)據(jù)表格中展示待辦任務的標題、提交者等。

讓智能體落地、真干活的最大難題,被訊飛這個平臺搞定了

在此之外,訊飛星辰智能體平臺還通過多模交互的能力,重構智能體與世界的連接方式,讓其實現(xiàn)更高效落地??拼笥嶏w以訊飛星辰智能體為基礎,聚焦中東、東南亞兩大市場,覆蓋基建招投標、法務與合同等八大智能體應用場景,打造全場景、全鏈路的出海智能生態(tài)。

智能體落地在真實一線已經(jīng)成為現(xiàn)實。

三、技術沉淀+生態(tài)壁壘,訊飛星辰智能體平臺加速拓寬能力邊界

從產(chǎn)業(yè)視角來看,這樣具備完善能力的智能體平臺,除了是技術層面的關鍵突破,還有望成為重構人機協(xié)作模式、拓展智能體服務邊界的核心基礎設施。

其產(chǎn)業(yè)價值體現(xiàn)在兩大維度,一方面其可以形成一套可復用的角色定制模板、運動控制算法庫、交互決策引擎,從而反哺下一代的大模型訓練;另一方面能讓智能體低成本、高適配地嵌入垂直場景,降低其使用門檻。

但正如前文所述,想要構建擁有完善能力的智能體平臺難度很高,而訊飛星辰智能體平臺的升級成果,正是訊飛過往技術積淀與全棧能力的有力印證。

在生態(tài)層面,訊飛已經(jīng)圍繞AI構建起多個生態(tài)平臺。

其中訊飛開放平臺的生態(tài)規(guī)模尤為亮眼。截至2025年12月31日,該平臺已匯聚超1026.5萬開發(fā)者團隊,開放920項AI產(chǎn)品及能力,平臺總應用數(shù)突破387.3萬,累計覆蓋終端設備數(shù)更是超42.8億臺。

更為垂直的開發(fā)平臺方面,訊飛星辰智能體平臺已經(jīng)落地高校、金融、醫(yī)療、車載等眾多行業(yè),打通了模型選擇、Agent開發(fā)、效果測評與多渠道發(fā)布全流程,此次重磅升級也證明,其已經(jīng)將“讓每個人都能創(chuàng)造自己的智能體”成為現(xiàn)實。

而在更細分的賽道布局上,其AI虛擬人交互平臺已經(jīng)構建了超10萬數(shù)字分身與500萬個人音庫; 交互方面的AIUI開放平臺,科大訊飛的數(shù)據(jù)顯示,目前這一平臺日均交互量突破3億次,連接開發(fā)者超過28萬,賦能終端設備達24億臺。

與此同時,科大訊飛在國內(nèi)大模型政企商業(yè)化落地賽道,也形成了技術、場景、交付層面的領先優(yōu)勢,根據(jù)智能超參數(shù)今年1月初發(fā)布的《中國大模型中標項目監(jiān)測與洞察報告 (2025) ?》,2025年科大訊飛中標項目數(shù)量達210個,中標總金額23.15億元,中標項目數(shù)量和金額均位列第一。

這些多維度、全場景的生態(tài)平臺布局,是訊飛星辰智能體平臺此次重磅升級、構筑起全棧技術能力的核心基石。

在軟硬件產(chǎn)品層面,科大訊飛已經(jīng)構筑起數(shù)個原生AI應用以及硬件產(chǎn)品矩陣

例如訊飛繪文、訊飛智文、訊飛智作均圍繞著內(nèi)容創(chuàng)作者的全方位需求,為其提供一站式解決方案。截至2025年底,訊飛繪文累計生成文章超3334萬篇、創(chuàng)意圖片超1166萬張,訊飛智文累計創(chuàng)作2.35億頁PPT、生成1.01億張PPT配圖,訊飛智作已匯聚超500萬AI創(chuàng)作者,提供300多個公共形象與1000多個發(fā)音人資源。

正是這種技術、生態(tài)、產(chǎn)品的全方位積淀,讓科大訊飛得以突破行業(yè)壁壘,打造出能力完備的訊飛星辰智能體平臺,為智能體行業(yè)的發(fā)展提供了可參考的實踐路徑,讓每個人都能創(chuàng)造可落地、個性化的智能體成為現(xiàn)實。

當下正處于智能體規(guī)?;瘧玫年P鍵窗口期,科大訊飛正通過實現(xiàn)底層技術、平臺工具、行業(yè)方案、全球市場的全鏈路布局,推動智能體解決方案在不同區(qū)域的落地生根。

結語:全棧智能體平臺正打破場景適配痛點

從行業(yè)視角來看,具備自然交互、定制角色、自動執(zhí)行核心能力的智能體平臺,正成為破解各垂直領域痛點的關鍵。

當下制造、醫(yī)療、消費、金融、車載等各行業(yè)的智能升級需求愈發(fā)迫切,卻普遍面臨通用技術與場景化需求適配不深、定制開發(fā)成本高、落地效率低等行業(yè)共性問題,而訊飛星辰智能體平臺的此次重磅升級,正精準切中這些行業(yè)核心訴求。

隨著智能體邁向規(guī)模化落地,或許相應平臺所積淀形成的可復用技術框架、標準化開發(fā)流程與生態(tài)協(xié)同模式,還能進一步降低各行業(yè)智能化轉(zhuǎn)型的技術門檻、開發(fā)成本與落地周期,進一步推動智能體技術在千行百業(yè)的規(guī)模化落地與深度應用。