智東西(公眾號(hào):zhidxcom)
作者 | 程茜
編輯 | 漠影

智東西6月28日下午,昨日下午,科大訊飛的星火大模型迎來(lái)重磅升級(jí),基于全國(guó)首個(gè)國(guó)產(chǎn)萬(wàn)卡算力集群“飛星一號(hào)”的訊飛星火大模型V4.0性能表現(xiàn)已超越GPT-4 Turbo,并且相關(guān)應(yīng)用已經(jīng)在醫(yī)療、教育等領(lǐng)域落地。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

星火大模型核心性能的升級(jí)以及與千行百業(yè)業(yè)務(wù)場(chǎng)景的深入結(jié)合,與當(dāng)下大模型產(chǎn)業(yè)的兩大焦點(diǎn)問(wèn)題密切相關(guān)。

一開(kāi)場(chǎng),科大訊飛董事長(zhǎng)劉慶峰就談道,一方面,底座大模型的能力決定了我們可以在通用人工智能的浪潮中走多遠(yuǎn);另一方面,大模型未來(lái)不僅將改變信息獲取、內(nèi)容生產(chǎn)模式,還會(huì)改變整個(gè)產(chǎn)業(yè)競(jìng)爭(zhēng)格局、科研范式,因此對(duì)于企業(yè)而言,讓大模型真正科學(xué)合理地在剛需場(chǎng)景中落地才更有價(jià)值

星火大模型V4.0在國(guó)內(nèi)外多個(gè)主流權(quán)威評(píng)測(cè)體系中,在多項(xiàng)能力中已經(jīng)全面超越GPT-4 Turbo,成為支撐大模型走向應(yīng)用的核心底座,與此同時(shí),科大訊飛推出星火企業(yè)智能體平臺(tái),通過(guò)交互的方式大幅降低智能體創(chuàng)建門檻,讓每個(gè)崗位都能擁有AI智能體。

可以看出,星火大模型V4.0以及基于其打造的自主可控、軟硬一體解決方案,就是科大訊飛為當(dāng)下大模型產(chǎn)業(yè)面對(duì)這兩大核心技術(shù)問(wèn)題亮出的最優(yōu)解之一。

一、全面對(duì)標(biāo)GPT-4 Turbo,可執(zhí)行復(fù)雜指令、空間推理等高階任務(wù)

國(guó)內(nèi)大模型已經(jīng)在全面趕超GPT-4 Turbo之路上突飛猛進(jìn),能力持續(xù)躍升必然是大模型產(chǎn)業(yè)當(dāng)下的必答題。

去年,科大訊飛參與設(shè)計(jì)的國(guó)產(chǎn)通用認(rèn)知智能大模型測(cè)評(píng)體系,形成覆蓋7個(gè)方面481個(gè)測(cè)試項(xiàng)的評(píng)估基準(zhǔn)。在七大衡量大模型的關(guān)鍵指標(biāo)中,星火大模型V4.0已經(jīng)在其中的文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力已經(jīng)全面超越GPT-4 Turbo。

另外的代碼能力和多模態(tài)能力上,星火大模型V4.0略有差距。劉慶峰談道,代碼能力是未來(lái)的產(chǎn)業(yè)信息化和信息產(chǎn)業(yè)化的核心,星火大模型預(yù)計(jì)在今年8月達(dá)到當(dāng)前GPT-4 Turbo 86分以上的水平。此外在多模態(tài)能力上,星火大模型圖文識(shí)別能力在科研、金融、醫(yī)療、司法、辦公等場(chǎng)景的應(yīng)用效果已領(lǐng)先GPT-4o。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

不僅如此,在國(guó)內(nèi)外中英文12項(xiàng)主流測(cè)試集中,星火V4.0在其中8項(xiàng)測(cè)試集中全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

在具體的業(yè)務(wù)場(chǎng)景中,訊飛星火V4.0的能力也在不斷進(jìn)階。

實(shí)際情況中,大模型往往需要聽(tīng)懂多元化的復(fù)雜指令,或者基于已有的空間信息進(jìn)行推理、基于邏輯關(guān)系進(jìn)行多模理解等。并且大模型生成內(nèi)容更為準(zhǔn)確、能夠減少幻覺(jué)對(duì)于應(yīng)用端來(lái)說(shuō)都至關(guān)重要。

因此,星火大模型長(zhǎng)文本能力在長(zhǎng)文檔要素抽取、長(zhǎng)文檔總結(jié)摘要、長(zhǎng)文檔問(wèn)答、長(zhǎng)文檔文本生成能力全面升級(jí)的同時(shí),還首發(fā)了內(nèi)容溯源功能。也就是說(shuō),用戶在查閱大模型生成的文本內(nèi)容時(shí),可以點(diǎn)擊答案附近的超鏈接,就能準(zhǔn)確找到這部分答案的出處。

中英文長(zhǎng)文檔以及音視頻等的解讀、問(wèn)答,星火大模型V4.0均可勝任,同時(shí)在溯源時(shí)能幫用戶快速定位到文字、視頻的相應(yīng)位置。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

當(dāng)根據(jù)兩篇長(zhǎng)文檔提問(wèn)孫悟空的金箍棒和哈利波特的魔杖有什么相同點(diǎn)和不同點(diǎn)時(shí),星火大模型V4.0從神奇屬性、身份象征以及材質(zhì)來(lái)源、功能等方面進(jìn)行了詳細(xì)分析。遇到不理解的部分,用戶可以直接點(diǎn)擊鏈接分分鐘找到內(nèi)容出處。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

同時(shí),星火大模型的圖文生成能力還從單張圖進(jìn)階到了多張圖片之間的邏輯理解、生成文本,可以根據(jù)多張圖片生成小故事并且進(jìn)行語(yǔ)音朗讀。正如下圖所演示的,將小兔子和小鳥(niǎo)的互動(dòng)情節(jié)進(jìn)行了生動(dòng)串聯(lián)。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

大模型的能力正在從單一的生成、問(wèn)答、理解能力進(jìn)階,向著更高階的能力演進(jìn),同時(shí)也逐漸朝著大模型走向落地應(yīng)用,解決企業(yè)或者個(gè)人真正需求的底座演進(jìn)。

二、兩大路徑、三大優(yōu)勢(shì),科大訊飛為企業(yè)大模型落地鋪路搭橋

從整個(gè)產(chǎn)業(yè)的發(fā)展格局來(lái)看,大模型的競(jìng)爭(zhēng)焦點(diǎn)已經(jīng)逐漸外延,從百模大戰(zhàn)、排名刷榜逐漸深入行業(yè)應(yīng)用中。

今年上半年,已經(jīng)有數(shù)十個(gè)大模型大單公布中標(biāo)結(jié)果。以訊飛星火大模型為代表的越來(lái)越多大模型玩家已經(jīng)奔赴大模型落地戰(zhàn),伴隨著下半年的新一批大單涌現(xiàn),AI落地應(yīng)用競(jìng)爭(zhēng)進(jìn)入白熱化態(tài)勢(shì)。

這背后,如何讓企業(yè)對(duì)于大模型應(yīng)用落地的感知度更強(qiáng),讓大模型與企業(yè)業(yè)務(wù)場(chǎng)景的結(jié)合更便捷、高效,且真正融入其核心痛點(diǎn)中至關(guān)重要。

相比于C端,企業(yè)業(yè)務(wù)場(chǎng)景的需求更為明確,且能深度集成至企業(yè)業(yè)務(wù)場(chǎng)景中進(jìn)行定制化,能在幫助企業(yè)解決復(fù)雜問(wèn)題、真正提質(zhì)增效,對(duì)于大模型玩家而言,其產(chǎn)品價(jià)值的體現(xiàn)也更具針對(duì)性。

總體來(lái)看,大模型賦能企業(yè)的核心路徑有兩條,一是基于認(rèn)知大模型的能力直接完成任務(wù),二是認(rèn)知大模型作為大腦,調(diào)度內(nèi)外部工具完成任務(wù)。

對(duì)大模型落地應(yīng)用的思考,正從訊飛星火大模型的全體系升級(jí)布局中清晰呈現(xiàn)出來(lái)。劉慶峰將大模型的能力邊界在企業(yè)應(yīng)用中進(jìn)行了更為細(xì)致的拆解,一般難度指的是代碼生成、文案翻譯、文本摘要等大模型可以拿來(lái)即用,中等難度就是需要企業(yè)對(duì)基座大模型進(jìn)行定制優(yōu)化,例如檢索類的知識(shí)問(wèn)答、多輪對(duì)話等應(yīng)用化的服務(wù)。

而高難度任務(wù)就是更難的數(shù)學(xué)推理、多階推理類知識(shí)問(wèn)答,這一能力需要開(kāi)放域的通用智能體來(lái)完成,但短期內(nèi)還沒(méi)有實(shí)現(xiàn)。

這對(duì)應(yīng)到企業(yè)中就是一個(gè)核心問(wèn)題,如何用更少的算力、更高的效率打造專屬模型和專屬應(yīng)用。這就對(duì)大模型玩家本身產(chǎn)品是否易用、好用、可用提出了更高的要求,這也是企業(yè)為大模型買單的關(guān)鍵。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

因此,科大訊飛在錨定真正讓大模型落地應(yīng)用這一核心目標(biāo)之后,將自己的技術(shù)優(yōu)勢(shì)、應(yīng)用經(jīng)驗(yàn)、生態(tài)范式真正打通。

從去年發(fā)布至今,訊飛星火大模型能力不斷躍升,且打造了面向企業(yè)的智能體開(kāi)發(fā)平臺(tái),進(jìn)一步降低企業(yè)業(yè)務(wù)與大模型能力相互影響、對(duì)齊的門檻。

與此同時(shí),作為AI國(guó)家隊(duì)的科大訊飛,在加速當(dāng)下國(guó)內(nèi)大模型商業(yè)化加速落地過(guò)程中具有天然的優(yōu)勢(shì),其技術(shù)實(shí)力在AI產(chǎn)業(yè)的發(fā)展中已經(jīng)被充分驗(yàn)證。以智能語(yǔ)音交互技術(shù)為例,深耕十余年且近日科大訊飛拿下過(guò)去十年人工智能領(lǐng)域首個(gè)國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)——作為第一完成單位的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目斬獲國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

技術(shù)創(chuàng)新與產(chǎn)業(yè)落地在科大訊飛的業(yè)務(wù)布局中相輔相成。科大訊飛已經(jīng)在教育、醫(yī)療、汽車等諸多賽道上有了大量的商業(yè)化積累。訊飛星火大模型已經(jīng)應(yīng)用于國(guó)家能源集團(tuán)、中國(guó)石油、中國(guó)移動(dòng)、中國(guó)人保、太平洋保險(xiǎn)、交通銀行、奇瑞汽車、中國(guó)一汽、海爾集團(tuán)、美的集團(tuán)等各賽道頭部玩家的業(yè)務(wù)場(chǎng)景中。

在這些優(yōu)勢(shì)的支撐之上,科大訊飛正在朝著構(gòu)建面向未來(lái)的AI新生態(tài)突圍,以源頭技術(shù)生態(tài)、智能體生態(tài)、應(yīng)用生態(tài)、行業(yè)生態(tài)真正在大模型的發(fā)展過(guò)程中流轉(zhuǎn)起來(lái)。

科大訊飛正為大模型落地企業(yè)提供了無(wú)限的想象空間。

三、企業(yè)的專屬崗位AI助手,對(duì)話交互就能搞定智能體

伴隨著訊飛星火V4.0的重磅升級(jí),科大訊飛為大模型賦能企業(yè)亮出了另一大殺手锏——星火企業(yè)智能體平臺(tái),為每個(gè)崗位打造專屬的AI助手。

在解決企業(yè)大模型應(yīng)用最后一公里上,劉慶峰談道,企業(yè)首先要科學(xué)地認(rèn)識(shí)大模型能力的邊界,根據(jù)任務(wù)難度選擇合適方案,并且用更少的算力、更高的效率,打造企業(yè)專屬大模型?;谛腔餠4.0的強(qiáng)大能力,他認(rèn)為用智能體平臺(tái)打造每個(gè)崗位的專屬助手的時(shí)間已經(jīng)到了。

智能體在企業(yè)的業(yè)務(wù)場(chǎng)景中,可以通過(guò)拆解分析用戶的任務(wù)需求并進(jìn)行任務(wù)執(zhí)行的步驟規(guī)劃,然后匹配相應(yīng)的任務(wù)工具,同時(shí)調(diào)用打通內(nèi)外部知識(shí)信源,最后能夠準(zhǔn)確執(zhí)行用戶的任務(wù)需求。

現(xiàn)在科大訊飛將企業(yè)創(chuàng)建智能體的門檻降低,只需三個(gè)步驟:提出需求、構(gòu)建智能體、功能驗(yàn)證。用戶只需說(shuō)出需求,就可以實(shí)現(xiàn)一句話創(chuàng)建。在對(duì)話框中,用戶只需要說(shuō)出智能體的相應(yīng)功能,該平臺(tái)就會(huì)自動(dòng)生成開(kāi)場(chǎng)白、所需信源、技能規(guī)劃等。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

如果企業(yè)內(nèi)部的辦公平臺(tái)已經(jīng)與星火智能體平臺(tái)連接,智能體還會(huì)自動(dòng)同步到企業(yè)內(nèi)部辦公平臺(tái)上,用戶就可以進(jìn)行功能驗(yàn)證。

以下圖演示的彩頁(yè)智能分析專家為例,用戶可以直接上傳彩頁(yè)圖片,該智能體就可以通過(guò)OCR識(shí)別并將其中的信息進(jìn)行結(jié)構(gòu)化呈現(xiàn),并且迅速檢索給出企業(yè)的核心業(yè)務(wù)以及與其他公司的合作方向等供用戶參考,最后將這些內(nèi)容進(jìn)行總結(jié)梳理,以分析報(bào)告的形式發(fā)送到用戶郵箱中。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

如見(jiàn)簡(jiǎn)便高效的智能體生成流程,這背后依靠的是星火企業(yè)智能體平臺(tái)的三大關(guān)鍵能力,AI原子能力、集成外部信源、打通內(nèi)部IT系統(tǒng)。

劉慶峰透露,目前AI原子能力集成已經(jīng)超過(guò)400多家,涵蓋90多個(gè)重要外部信源,打通了超過(guò)100個(gè)的內(nèi)部IT系統(tǒng),包括公司的財(cái)務(wù)、法務(wù)等諸多部門。

在常見(jiàn)的生產(chǎn)、科創(chuàng)、辦公和管理領(lǐng)域,科大訊飛已經(jīng)首批創(chuàng)建了32個(gè)企業(yè)智能體,企業(yè)可實(shí)現(xiàn)即插即用。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

特別在AI編程領(lǐng)域,正如前文所所提到的,其在信息化產(chǎn)業(yè)與產(chǎn)業(yè)信息化的發(fā)展中至關(guān)重要,因此科大訊飛不斷迭代代碼智能體iFlyCode,可以滿足代碼生成、架構(gòu)設(shè)計(jì)、代碼問(wèn)答、測(cè)試、數(shù)據(jù)庫(kù)優(yōu)化、代碼審核方面實(shí)現(xiàn)應(yīng)用。在科大訊飛內(nèi)部,代碼智能體的代碼采納率已經(jīng)從30%提升到52%。

此外,還有企業(yè)中需要大量數(shù)據(jù)分析處理、信息檢索或者耗時(shí)耗力的商機(jī)線索、評(píng)標(biāo)等方面,訊飛創(chuàng)建的企業(yè)智能體已經(jīng)深入不同的企業(yè)業(yè)務(wù)流程中,幫助不同環(huán)節(jié)的員工實(shí)現(xiàn)了將本增效。

面向企業(yè),科大訊飛還在人機(jī)交互領(lǐng)域,全面升級(jí)了支持37個(gè)語(yǔ)種、37種方言自由對(duì)話的星火語(yǔ)音大模型,重構(gòu)用戶的交互體驗(yàn),已應(yīng)用在星火汽車智能座艙等產(chǎn)品里。在家電、機(jī)器人、運(yùn)營(yíng)商等行業(yè)場(chǎng)景下,科大訊飛的云邊端和軟硬件一體化解決方案也為這些玩家提供了更具靈活性的方案,去釋放大模型潛能。

當(dāng)下,企業(yè)的數(shù)字化轉(zhuǎn)型需求,與大模型日益進(jìn)階的性能提升相契合??拼笥嶏w已經(jīng)形成了底座大模型支撐,外加通過(guò)智能體平臺(tái)深入業(yè)務(wù)“細(xì)枝末節(jié)”,為企業(yè)搭建起堅(jiān)實(shí)的技術(shù)底座。

還有更為重要的一點(diǎn)是,劉慶峰強(qiáng)調(diào),新的AI生態(tài)體系建設(shè)的根基就是底座技術(shù)完全可控,總結(jié)起來(lái)就是“軟硬一體+自主可控”。這也正是訊飛星火大模型V4.0此次升級(jí)迭代的底層邏輯,既真正為企業(yè)釋放大模型價(jià)值,又要讓軟硬件一體化的解決方案成長(zhǎng)于中國(guó)自己的土壤之上。

打通大模型行業(yè)應(yīng)用任督二脈!看訊飛星火如何做好大模型落地“必答題”

結(jié)語(yǔ):大模型商業(yè)化落地爆點(diǎn)降至,科大訊飛率先布局

大模型在企業(yè)的各個(gè)業(yè)務(wù)環(huán)節(jié)中發(fā)揮作用、釋放價(jià)值已經(jīng)成為這一產(chǎn)業(yè)發(fā)展的重要趨勢(shì),因此,大模型玩家與不同的企業(yè)需要對(duì)大模型本身的能力以及企業(yè)的核心痛點(diǎn)進(jìn)行拆解與對(duì)齊,在此之上才能讓AI能力真正普惠,落地到千行百業(yè)之中。

點(diǎn)點(diǎn)“星火”,已成燎原之勢(shì)。訊飛星火正在以基座大模型為核心,進(jìn)一步助攻大模型技術(shù)在各行各業(yè)的規(guī)模化普及。對(duì)于國(guó)內(nèi)的大模型玩家而言,既需要科學(xué)理性認(rèn)識(shí)到中美科技的綜合差異,還需要在朝著通用人工智能加速前進(jìn)的同時(shí),以長(zhǎng)期主義來(lái)打造真正自主可控的AI產(chǎn)業(yè)生態(tài)。

科大訊飛已經(jīng)成為先行者,并且讓大模型在企業(yè)剛需場(chǎng)景的更多應(yīng)用價(jià)值逐漸被釋放出來(lái),加速大模型應(yīng)用生態(tài)的蓬勃發(fā)展。