智東西(公眾號(hào):zhidxcom)
作者 |? 程茜
編輯 |? 李水青

智東西11月6日?qǐng)?bào)道,今天,科大訊飛發(fā)布基于全國(guó)產(chǎn)算力的訊飛星火X1.5深度推理大模型,在全國(guó)產(chǎn)算力平臺(tái)上攻克MoE模型全鏈路訓(xùn)練效率,端到端性能達(dá)到國(guó)際競(jìng)品效率的93%以上。

科大訊飛董事長(zhǎng)劉慶峰透露,該模型的語(yǔ)言理解、文本生成、知識(shí)問答、邏輯推理、數(shù)學(xué)能力、代碼能力等可對(duì)標(biāo)國(guó)際主流大模型。同時(shí),星火多語(yǔ)言能力升級(jí)后支持130+種語(yǔ)言,整體性能達(dá)到GPT-5的95%以上。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

劉慶峰談道,當(dāng)下AI紅利兌現(xiàn)的四大關(guān)鍵核心是自主可控、軟硬一體、行業(yè)縱深、個(gè)性化。自主可控方面,目前在國(guó)內(nèi)主流大模型中,訊飛星火是唯一基于全國(guó)產(chǎn)算力訓(xùn)練的通用大模型。

科大訊飛還集中展示了在教育、醫(yī)療等諸多領(lǐng)域的落地進(jìn)展。

科大訊飛正式發(fā)布AI軟硬一體解決方案,搭載這一方案的訊飛智能辦公本X5、訊飛AI翻譯耳機(jī)、訊飛雙屏翻譯機(jī)2.0降噪能力升級(jí);具備高度多模態(tài)交互能力的數(shù)字人導(dǎo)覽“小飛”亮相上崗,能夠?qū)崿F(xiàn)多人自由對(duì)話、多語(yǔ)種交流,并具備個(gè)性化記憶能力;醫(yī)療方面,科大訊飛發(fā)布智醫(yī)助理醫(yī)院版1.0,支持輔助診療、輔助會(huì)診、病歷生成、病歷質(zhì)控;其發(fā)布原生AI陪伴App AI星朋友,支持160種人設(shè)定制;面向開發(fā)者,科大訊飛打造了首個(gè)支持RPA的智能體平臺(tái)Astron。

此外,科大訊飛還首發(fā)百變聲音復(fù)刻技術(shù),用戶僅需一句錄音即可高保真復(fù)刻任意音色,再通過一條指令便可創(chuàng)造任意風(fēng)格音頻。

現(xiàn)場(chǎng),科大訊飛副總裁、研究院執(zhí)行院長(zhǎng)劉聰基于一段音頻創(chuàng)建了華為常務(wù)董事、終端BG董事長(zhǎng)余承東說霸氣將軍、神奇法師風(fēng)格的聲音。

同時(shí),百變聲音復(fù)刻技術(shù)還支持英語(yǔ)、阿拉伯語(yǔ)、德語(yǔ)等多語(yǔ)音生成,其還基于余承東音色演示了說英語(yǔ)和阿拉伯語(yǔ)的聲音。

一、星火X1.5推理效率翻倍,1臺(tái)昇騰標(biāo)配服務(wù)器可部署

劉慶峰首先展示了科大訊飛在自主可控和底座模型上的進(jìn)展。

科大訊飛此次發(fā)布的基于全國(guó)產(chǎn)算力的訊飛星火X1.5深度推理大模型,總參數(shù)量293B,激活參數(shù)量30B,1臺(tái)昇騰標(biāo)配服務(wù)器可部署,推理效率相比X1提升100%。

星火X1.5在數(shù)學(xué)、綜合答題、代碼、知識(shí)問答、智能體等大模型測(cè)試任務(wù)中效果領(lǐng)先。高考數(shù)學(xué)測(cè)評(píng)結(jié)果中,星火X1.5得分145分,GPT-5得分141,DeepSeek V3.2-Exp得分140。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

在國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽IMO 2025第三題中,星火X1.5給出了正確答案。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

還有教育和醫(yī)療方面,訊飛星火教育大模型、醫(yī)療大模型在輔助教學(xué)、輔助學(xué)習(xí)、輔助考試以及醫(yī)療知識(shí)問答、語(yǔ)言理解、診療推薦等方面,測(cè)評(píng)效果表現(xiàn)都超過GPT-5和DeepSeek V3.2-Exp。劉慶峰稱,教育方面大模型能力平均得到超85分是一個(gè)門檻,過線的大模型寥寥無幾。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

此外,科大訊飛的多語(yǔ)言大模型能力持續(xù)升級(jí),星火X1.5支持130多種語(yǔ)言,星火語(yǔ)音同傳大模型2.0在知名行研機(jī)構(gòu)IDC的評(píng)估報(bào)告中,8項(xiàng)評(píng)測(cè)拿下行業(yè)第一。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

在模型能力升級(jí)方面,一周前,科大訊飛發(fā)布非自回歸語(yǔ)音大模型架構(gòu),相比同尺寸的自回歸語(yǔ)音大模型,效果相對(duì)提升16%,推理成本下降520%,已經(jīng)在訊飛輸入法上線。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

二、麥克風(fēng)、揚(yáng)聲器、攝像頭、顯示技術(shù)升級(jí),加速AI在真實(shí)世界落地

軟硬一體是AI在真實(shí)世界應(yīng)用落地的關(guān)鍵,劉慶峰談道,而AI+麥克風(fēng)陣列、AI+揚(yáng)聲器陣列、AI+攝像頭陣列、AI+視覺呈現(xiàn)目前是支撐AI軟硬一體落地的關(guān)鍵技術(shù)。

首先,科大訊飛基于AI+麥克風(fēng)陣列技術(shù),實(shí)現(xiàn)了遠(yuǎn)場(chǎng)高噪場(chǎng)景語(yǔ)音識(shí)別和聲源定位,支持語(yǔ)音屬性解耦、信號(hào)時(shí)空分離等。

30、60、80分貝的高噪音轉(zhuǎn)寫場(chǎng)景下,科大訊飛X5 Pro辦公本的準(zhǔn)確率都達(dá)到95%以上,超過iPhone 17 Pro,以及在不同距離下進(jìn)行轉(zhuǎn)寫實(shí)測(cè),X5 Pro的轉(zhuǎn)寫準(zhǔn)確率均超過iPhone 17 Pro。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

訊飛AI翻譯耳機(jī)采用骨傳導(dǎo)、氣導(dǎo)雙拾音降噪,在80分貝的食堂、地鐵等高噪環(huán)境下,該耳機(jī)識(shí)別準(zhǔn)確率為97.1%,AirPods 3為77.7%。

訊飛翻譯機(jī)采用5麥克風(fēng)陣列,可以隔離1米以外的人聲和噪聲。強(qiáng)降噪模式下,距離1米左右,翻譯機(jī)就會(huì)自動(dòng)屏蔽人聲,走近才會(huì)繼續(xù)正常收音。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

基于科大訊飛的獨(dú)家AI+揚(yáng)聲器陣列技術(shù),其自研揚(yáng)聲器硬件設(shè)計(jì)技術(shù),實(shí)現(xiàn)立體空間聲場(chǎng)重構(gòu)和均衡。iFLYSOUND的立體聲場(chǎng)效果,已經(jīng)在19家車企量產(chǎn)落地,出貨超100萬(wàn)臺(tái),奇瑞等車廠的盲測(cè)結(jié)果顯示,其效果超越寶馬740i。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

在教育場(chǎng)景下,訊飛AI黑板支持24通道AI揚(yáng)聲器陣列,使得前后排聲壓差≤3dB,輔音清晰度損失低于4%。

在顯示方面,為了讓教室內(nèi)的學(xué)生都能看清黑板,其AI黑板還重構(gòu)了光路,科大訊飛AI學(xué)習(xí)機(jī)采用了微納米類紙屏等,搭載坐姿AI算法進(jìn)行坐姿提醒。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

劉慶峰談道,軟硬一體支撐的多模態(tài)交互是AI融入真實(shí)世界的物理基礎(chǔ)。

他認(rèn)為,真正的多模態(tài)交互需要具備沒有麥克風(fēng)的遠(yuǎn)場(chǎng)識(shí)別、3D視覺感知、視聽覺融合理解、超擬人數(shù)字人、多人主動(dòng)交互、類人舉止反饋、個(gè)性化記憶、情感語(yǔ)義。具備高度多模態(tài)交互能力的數(shù)字人導(dǎo)覽小飛展示了AI不再是簡(jiǎn)單的APP,而是能走進(jìn)真實(shí)物理空間、提供有情感、有深度服務(wù)的類人伙伴,標(biāo)志著人機(jī)交互正變得更自然、高效和穩(wěn)健。

小飛突破了簡(jiǎn)單問答的局限,能夠?qū)崿F(xiàn)多人自由對(duì)話、多語(yǔ)種交流,并具備個(gè)性化記憶能力,能記住訪客歷史信息并進(jìn)行提醒。此外,她還能秒變“林黛玉”等多種虛擬形象。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

此外,星火X1.5還搭載了個(gè)性化記憶能力,基于多源記憶庫(kù)信息檢索和應(yīng)用實(shí)現(xiàn)個(gè)性化記憶識(shí)別、提取、更新。

三、教育、醫(yī)療、辦公場(chǎng)景能力升級(jí),首發(fā)AI陪伴App

科大訊飛還展示了其在教育、醫(yī)療、汽車、辦公方面的進(jìn)展。

在教育方面,科大訊飛聯(lián)手權(quán)威機(jī)構(gòu)首創(chuàng)三級(jí)錯(cuò)因體系,通過3大類、3層級(jí)、4000多個(gè)錯(cuò)因標(biāo)簽,為學(xué)生制定科學(xué)的學(xué)習(xí)計(jì)劃。

與此同時(shí),其還將這一能力搭載到教師的訊飛星火智能批閱機(jī)中。這一設(shè)備可以實(shí)現(xiàn)對(duì)解答題的分步驟批改、錯(cuò)因訂正,還會(huì)為學(xué)生生成歷次學(xué)情報(bào)告,為老師生成班級(jí)學(xué)情報(bào)告。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

星火教師助手會(huì)根據(jù)學(xué)情報(bào)告,建議教師在備課PPT中新增相應(yīng)的典型錯(cuò)題、重難點(diǎn)講解等。

這樣一來,星火批閱機(jī)、星火教師助手、星火AI黑板這樣的軟硬結(jié)合系統(tǒng),就能實(shí)現(xiàn)作業(yè)精細(xì)批改到課堂因材施教的小時(shí)級(jí)閉環(huán)。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

在現(xiàn)場(chǎng),訊飛AI學(xué)習(xí)機(jī)展示了作業(yè)輔導(dǎo)能力,其針對(duì)卷子上的第二題進(jìn)行了講解。

AI老師會(huì)先判斷學(xué)生的整體思路,以及每個(gè)步驟是否正確,明確指出哪個(gè)步驟出現(xiàn)了什么問題,然后引導(dǎo)學(xué)生思考是否缺少關(guān)鍵思路,還會(huì)配合相應(yīng)的演示圖進(jìn)行講解。最后AI老師對(duì)學(xué)生訂正好的答案進(jìn)行批閱,然后進(jìn)行方法總結(jié)。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

醫(yī)療方面,科大訊飛的智醫(yī)助理中,在推薦診斷界面,醫(yī)生可以對(duì)應(yīng)查看知識(shí)圖譜、診斷推理路徑。同時(shí)醫(yī)生可以參考推薦內(nèi)容進(jìn)行問診,再結(jié)合新增癥狀實(shí)時(shí)更新診斷情況,值得一提的是,智醫(yī)助理還搭載了中醫(yī)診斷能力。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

劉慶峰提到,星火醫(yī)療大模型??艫I能力已經(jīng)達(dá)到等級(jí)醫(yī)院主任級(jí)醫(yī)師水平。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

此外,科大訊飛還發(fā)布智醫(yī)助理醫(yī)院版1.0,支持輔助診療、輔助會(huì)診、病歷生成、病歷質(zhì)控,面對(duì)患者,其升級(jí)了訊飛曉醫(yī)App,可以為用戶提供問題解答、掛號(hào)輔助等諸多能力。

汽車領(lǐng)域,星火智慧座艙2.0融合13攝,場(chǎng)景識(shí)別可以實(shí)現(xiàn)服務(wù)匹配度≥95%。

如下面動(dòng)圖所示,曉醫(yī)健康座艙檢測(cè)到用戶頻繁眨眼,會(huì)結(jié)合用戶的健康檔案判斷是否是干眼癥,經(jīng)用戶確認(rèn)后購(gòu)買滴眼液送到目的地。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

辦公方面,訊飛智能辦公本、訊飛聽見等軟硬件產(chǎn)品已經(jīng)深入用戶工作之中。

訊飛智能辦公本生成的會(huì)議紀(jì)要會(huì)給出總結(jié)、重點(diǎn)關(guān)注等信息,同時(shí)基于用戶手寫記錄的關(guān)注點(diǎn)給出重點(diǎn)提煉,結(jié)合用戶的身份和偏好終點(diǎn)推送。會(huì)議中提到的任務(wù)待辦也能同步加入日程,還能與用戶協(xié)作處理待辦任務(wù)。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

科大訊飛還推出了原生AI陪伴App AI星朋友,可支持160種人設(shè)定制,10秒就能創(chuàng)建聲音。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

在開發(fā)者生態(tài)方面,星火開放平臺(tái)生態(tài)開發(fā)者已經(jīng)從2024年10月的767萬(wàn)增長(zhǎng)到今年10月的968萬(wàn),其中智能硬件開發(fā)者增長(zhǎng)102%,大模型企業(yè)開發(fā)者增長(zhǎng)125%,新型智能體開發(fā)者成為增長(zhǎng)主力,近半數(shù)來自非技術(shù)領(lǐng)域。

面向開發(fā)者,科大訊飛打造了首個(gè)支持RPA的智能體平臺(tái)Astron,大同企業(yè)內(nèi)卻收借口的IT系統(tǒng)和賬號(hào)體系,實(shí)現(xiàn)8大行業(yè)智能體開箱即用。

一句錄音,現(xiàn)場(chǎng)讓余承東“說阿拉伯語(yǔ)”!科大訊飛掏出AI落地最新成果

結(jié)語(yǔ):全國(guó)產(chǎn)算力支撐,加速AI大模型落地提效

AI是硬科技、強(qiáng)技術(shù)競(jìng)爭(zhēng),AI應(yīng)用落地至關(guān)重要??拼笥嶏w堅(jiān)持在自主可控、軟硬一體、行業(yè)縱深、個(gè)性化四大關(guān)鍵領(lǐng)域發(fā)力,此次發(fā)布了星火X1.5深度推理大模型及一系列軟硬件產(chǎn)品,從技術(shù)底座到行業(yè)應(yīng)用,全面展示了AI從可用到好用,再到深入工作、學(xué)習(xí)、生活等的進(jìn)展。

當(dāng)下,大模型正處于邁向應(yīng)用落地的關(guān)鍵轉(zhuǎn)型期。從長(zhǎng)遠(yuǎn)和產(chǎn)業(yè)發(fā)展的宏觀視角來看,如何讓大模型深度嵌入千行百業(yè),切實(shí)解決行業(yè)痛點(diǎn)、賦能業(yè)務(wù)流程,才是決定其真正價(jià)值與發(fā)展?jié)摿Φ暮诵拿}??拼笥嶏w此前的技術(shù)積累以及與產(chǎn)業(yè)客戶的結(jié)合,或稱為率先兌現(xiàn)AI紅利的關(guān)鍵。