智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 漠影

大模型毋庸置疑是去年以來科技行業(yè)的“主角”,今天,大模型產(chǎn)業(yè)競爭的核心已然改變。

自2022年11月ChatGPT發(fā)布掀起的科技革命,到百模大戰(zhàn)群雄逐鹿,如今隨著大模型與產(chǎn)業(yè)落地的結(jié)合日益緊密,各類應(yīng)用層出不窮,大模型商業(yè)化成為所有參與者的核心目標(biāo)。2024年儼然已經(jīng)成為大模型商業(yè)化元年。

此前大模型受研發(fā)成本高昂、落地場景不明晰、部署成本高等困擾商業(yè)化進(jìn)程緩慢。就在昨天,2024年農(nóng)歷春節(jié)前夕,AI國家隊(duì)、國內(nèi)大模型產(chǎn)業(yè)賽道的重要玩家科大訊飛給出了自己的破局之道。

科大訊飛董事長劉慶峰、研究院院長劉聰正式發(fā)布基于首個(gè)全國產(chǎn)算力訓(xùn)練的訊飛星火V3.5,訊飛星火V3.5七大核心能力全面提升,數(shù)學(xué)、語言理解、語音交互能力超GPT-4 Turbo。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

科大訊飛發(fā)布了星火語音大模型,語音識別方面首批37個(gè)主流語種效果超過OpenAI Whisper V3,基于此重磅升級了能自動識別語種的訊飛翻譯機(jī),并首次發(fā)布深度適配國產(chǎn)算力的訊飛星火開源大模型“星火開源-13B”,已在昇思開源社區(qū)聯(lián)合首發(fā)上線。

自去年5月以來,以訊飛星火認(rèn)知大模型為核心的技術(shù)積累與應(yīng)用經(jīng)驗(yàn),已經(jīng)成為科大訊飛在大模型商業(yè)化應(yīng)用元年的重要支撐。

那么,曾困擾大模型商業(yè)化的難題如何解?科大訊飛眼中的大模型落地場景應(yīng)該是什么樣?科大訊飛又是如何找到一步步走出屬于自己的路,成為行業(yè)引領(lǐng)者?我們試圖從科大訊飛星火大模型V3.5的重磅升級出發(fā),找到這些問題的答案。

一、大模型進(jìn)入商業(yè)化元年,三大難題待解

轟轟烈烈的百模大戰(zhàn)熱潮逐漸冷靜,但技術(shù)變革的深遠(yuǎn)影響尚未停歇,科技發(fā)展的進(jìn)階無不是真正與產(chǎn)業(yè)相結(jié)合,在真正的應(yīng)用中發(fā)揮價(jià)值。

數(shù)據(jù)研究和分析機(jī)構(gòu)Gartner預(yù)測,到2026年超過80%的企業(yè)將使用生成式AI的API(應(yīng)用程序編程接口)、模型,或在生產(chǎn)環(huán)境中部署支持生成式AI的應(yīng)用,而在2023年初這一比例不到5%。

但一直以來,大模型真正在行業(yè)應(yīng)用中發(fā)揮價(jià)值,走向落地的進(jìn)程都十分緩慢。這與大模型的能力、應(yīng)用落地場景、算力三大挑戰(zhàn)有關(guān)。

首先是模型能力的挑戰(zhàn)。大模型的幻覺、智能化程度不夠等問題,直接會影響不同行業(yè)用戶對其的接受程度。不同于消費(fèi)者,企業(yè)對于數(shù)據(jù)的安全隱私、大模型的可用性、生成內(nèi)容的準(zhǔn)確性要求極高,因此大模型除強(qiáng)大的生成、理解等能力,還需要真正解決行業(yè)問題,在業(yè)務(wù)中發(fā)揮價(jià)值。

其次是應(yīng)用場景的挑戰(zhàn)。大模型需要找到有效的落地場景,其在企業(yè)內(nèi)部的應(yīng)用范圍十分寬泛,需要和內(nèi)部大量數(shù)據(jù)進(jìn)行深度融合,找到企業(yè)真正的痛點(diǎn),并通過大模型的能力加以解決。這才能讓企業(yè)最迫切的需求與大模型能力相互匹配,在進(jìn)一步提升大模型能力的同時(shí),形成豐富的應(yīng)用場景。

第三是算力挑戰(zhàn)。這既包含企業(yè)定制、微調(diào)大模型的算力成本,還包含國產(chǎn)大模型算力底座的自主可控。

對于下游企業(yè)而言,其沒有足夠算力成本去定制、微調(diào)大模型。算力是大模型訓(xùn)練和推理階段極為重要的物質(zhì)基礎(chǔ),但大模型熱潮涌起使得算力成本高漲,中小企業(yè)難以維系。然而,企業(yè)想要讓大模型與自己業(yè)務(wù)深度結(jié)合,就必須對大模型進(jìn)行定制、微調(diào),這也成為企業(yè)面前的一大攔路虎。

受波譎云詭的國際形勢影響,國產(chǎn)化大模型產(chǎn)業(yè)的自主可控也是一大難題。只有建立在自主可控的國產(chǎn)化算力平臺上,大模型產(chǎn)業(yè)才能實(shí)現(xiàn)可持續(xù)的良好發(fā)展。

隨著這些難題被逐漸突破,大模型的實(shí)用性更上一個(gè)臺階,結(jié)合其綜合能力解決真實(shí)世界的剛需被提上日程。在這一背景下,在大模型核心能力升級、商業(yè)落地應(yīng)用、算力平臺部署上面有諸多經(jīng)驗(yàn)的訊飛,已經(jīng)成為大模型商業(yè)化準(zhǔn)備最充分的玩家代表,并向著成為大模型落地的領(lǐng)跑者突圍。

二、訊飛星火V3.5升級,發(fā)語音、開源大模型,均基于全國產(chǎn)算力平臺“飛星一號”訓(xùn)練

大模型改變世界的愿景逐漸清晰,那么站在大模型商業(yè)化元年?科大訊飛到底有哪些儲備?又該如何領(lǐng)跑?我們可以從這場發(fā)布會的重點(diǎn)抽離出這家如今大模型頭部玩家的布局邏輯,也代表了下一步大模型商業(yè)落地的競爭焦點(diǎn)。

訊飛星火V3.5實(shí)現(xiàn)了文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力七大核心能力升級。其中,語言理解、數(shù)學(xué)能力超過GPT-4 Turbo,代碼能力達(dá)到GPT-4 Turbo的96%,多模態(tài)理解能力達(dá)到GPT-4V的91%。

這些強(qiáng)大的能力已經(jīng)在解決真實(shí)世界的剛需方面展現(xiàn)出強(qiáng)大潛力。

萬物互聯(lián)時(shí)代的人機(jī)交互方式正在被重塑,訊飛星火App上線了語音交互功能,該功能在與人的對話中能自動調(diào)用大模型的外部能力,實(shí)現(xiàn)全語音的自然交互。劉慶峰談道,從DOS界面到Windows界面成就了微軟的傳奇,從鍵盤到觸摸有了蘋果的神話,這一次全語音的自然交互會推動整個(gè)產(chǎn)業(yè)出現(xiàn)新一次的繁榮。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

語音技術(shù)一直以來都是科大訊飛的強(qiáng)項(xiàng),自成立之初該公司就確定了實(shí)現(xiàn)人類和人機(jī)信息溝通無障礙的愿景??拼笥嶏w在通用人工智能時(shí)代,繼續(xù)保持在語音交互方面領(lǐng)先優(yōu)勢的同時(shí),看到了新技術(shù)浪潮下的更多可能性。大模型可以幫助小語種語料訓(xùn)練,通過更統(tǒng)一的多任務(wù)建模能力推動語音技術(shù)發(fā)展。

訊飛星火語音大模型基于語音屬性解耦表征預(yù)訓(xùn)練,結(jié)合常規(guī)的語音大模型架構(gòu),實(shí)現(xiàn)了首批37個(gè)主流語種語音識別效果超過OpenAI Whisper V3,在多語種語音合成、超擬人語音合成方面MOS分有絕對優(yōu)勢,MOS分指的就是生成的聲音是否自然。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

此次搭載星火語音大模型的訊飛翻譯機(jī)還實(shí)現(xiàn)了重磅升級,可以實(shí)現(xiàn)多語種自主識別,無需用戶自主選擇,就可以自動識別說話人的語種并翻譯成中文。

此外,為了豐富大模型應(yīng)用生態(tài),科大訊飛發(fā)布了130億參數(shù)規(guī)模的星火開源大模型系列,包括基礎(chǔ)模型、精調(diào)模型、微調(diào)工具和人設(shè)定制工具。星火開源-13B在多項(xiàng)知名公開評測任務(wù)中的文本生成、語言理解等典型場景中排名靠前。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

最后就是大模型訓(xùn)練的堅(jiān)實(shí)底座——算力平臺,訊飛星火V3.5、星火語音大模型、星火開源大模型都是基于“飛星一號”訓(xùn)練飛星一號就是去年10月24日訊飛宣布正式啟用的首個(gè)支撐萬億參數(shù)大模型訓(xùn)練的國產(chǎn)算力平臺。

訊飛星火V3.5是國內(nèi)首個(gè)基于全國產(chǎn)算力訓(xùn)練的大模型。星火開源大模型也基于飛星一號實(shí)現(xiàn)了全棧國產(chǎn)適配優(yōu)化,訓(xùn)練效率達(dá)A100的90%。這也意味著,科大訊飛為企業(yè)客戶提供了另外一種“大模型+算力”的選擇。

在這一特殊節(jié)點(diǎn),大模型要立足于國產(chǎn)自主可控的算力平臺至關(guān)重要,劉慶峰稱,訊飛星火3.5正是對于國產(chǎn)算力平臺能否支撐起未來大模型研發(fā)的一次重要檢驗(yàn)。

可以看出,科大訊飛在大模型產(chǎn)業(yè)的浪潮中很清楚自己要做什么,怎么做,并且在此前深厚的行業(yè)積累中,真正瞄準(zhǔn)了行業(yè)痛點(diǎn),知道自己要如何在這個(gè)行業(yè)中扎根生存并實(shí)現(xiàn)領(lǐng)先。

三、大模型升級與解決行業(yè)痛點(diǎn)并進(jìn),從通用大模型進(jìn)階到解決民生剛需

縱觀整個(gè)大模型產(chǎn)業(yè)的發(fā)展,如今的商業(yè)化之爭既是全球科技的競爭,也成為國內(nèi)生成式AI與全球同頻發(fā)展的關(guān)鍵環(huán)節(jié),國內(nèi)玩家這一波百模大戰(zhàn)也進(jìn)入了新的競爭關(guān)鍵。

從去年8月至今,國產(chǎn)大模型已經(jīng)有共計(jì)4批通過大模型備案面向公眾化開放,并且如今在金融、教育、辦公賽道已經(jīng)有諸多大模型應(yīng)用。

作為首批通過備案的訊飛星火大模型的應(yīng)用進(jìn)展也毫不遜色。自去年5月至今,星火大模型在七大核心能力不斷升級的同時(shí),硬件方面在教育領(lǐng)域打造了訊飛AI學(xué)習(xí)機(jī),辦公領(lǐng)域有訊飛智能辦公本、訊飛錄音筆,軟件方面有訊飛聽見、訊飛星火App、訊飛輸入法等,還有內(nèi)容創(chuàng)作的工具,如音視頻創(chuàng)作工具“訊飛智作”、圖文創(chuàng)作工具“星火內(nèi)容運(yùn)營大師”等已經(jīng)將大模型的價(jià)值逐漸釋放給大量的用戶。

在訊飛開放平臺之上,大模型總開發(fā)者超35萬,其中企業(yè)開發(fā)者超22萬。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

大量用戶的體驗(yàn)與反饋,也在反哺大模型核心能力的不斷提升。

與此同時(shí),劉慶峰談道,大模型如今已經(jīng)不是用來簡單的寫詩、作畫,而是賦能科研、賦能工業(yè)、賦能民生的剛需場景,就是要讓大模型能夠提升成為數(shù)字化時(shí)代、智能化時(shí)代的全新生產(chǎn)力

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

科技創(chuàng)新到產(chǎn)業(yè)落地的距離,需要終端企業(yè)用戶與核心大模型玩家的結(jié)合,才能逐漸縮短這之中的距離,同時(shí)也讓大模型商用落地的路徑更為清晰。

科大訊飛已經(jīng)在不同賽道上有了大量的商業(yè)化積累。面向教育行業(yè),科大訊飛推出了星火智慧黑板,具備多模態(tài)理解與推薦、全自然交互、虛擬人輔學(xué)、智慧化錄課與分享四大功能。這一功能將黑板的價(jià)值邊界進(jìn)一步擴(kuò)寬,成為老師的AI助手。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

同時(shí),科大訊飛與中國移動聯(lián)合推出5G新通話創(chuàng)新應(yīng)用“商務(wù)速記”,可以實(shí)現(xiàn)用戶通話過程中同步紀(jì)要語音、提煉關(guān)鍵待辦事項(xiàng)等。

汽車行業(yè)頭部玩家奇瑞汽車中應(yīng)用的智能語音交互技術(shù)由科大訊飛提供,其出口的國家覆蓋英語、俄羅斯語、西班牙語、阿拉伯語、葡萄牙語等數(shù)十個(gè)語種??梢钥闯?,支撐中國汽車出海也是國產(chǎn)大模型商業(yè)化落地的一大潛力場景。

國產(chǎn)大模型落地為王!訊飛星火如何快人一步?

由此可以看出,大模型正在同步驅(qū)動B端和C端商業(yè)化落地,一方面,翻譯機(jī)、商務(wù)5G通話、AI PPT等能力正在被大模型重塑,讓前沿技術(shù)創(chuàng)新成為個(gè)人用戶的生產(chǎn)力工具;另一方面各行各業(yè)的頭部玩家、創(chuàng)企正在與以科大訊飛為代表的大模型核心玩家,進(jìn)行商業(yè)化落地探索,在加速產(chǎn)業(yè)轉(zhuǎn)型升級的同時(shí)找到新的增長機(jī)遇。

更為重要的是,作為AI國家隊(duì)的科大訊飛,在當(dāng)下國內(nèi)大模型商業(yè)化加速落地的同時(shí),對于提供自主可控全國產(chǎn)算力平臺方面具有天然優(yōu)勢。

如今,大模型商業(yè)化應(yīng)用已經(jīng)聚集了算力、大模型、終端企業(yè)等各方玩家之力,使得大模型核心能力與應(yīng)用落地進(jìn)展同步推進(jìn),并且堅(jiān)持安全可控。

即便此前在大模型核心能力方面,國內(nèi)與國外一直存在較大差距,但進(jìn)入商業(yè)化落地的新階段,依托國內(nèi)豐富的應(yīng)用場景與落地土壤,以科大訊飛為代表的玩家正引領(lǐng)大模型新時(shí)代的變革。

結(jié)語:加碼大模型商業(yè)化落地,科大訊飛已快人一步

大模型在生成、理解等方面展現(xiàn)出的強(qiáng)大能力,使得AI正不斷拓寬其在千行百業(yè)中的應(yīng)用邊界。當(dāng)下,AI驅(qū)動的各類應(yīng)用正在變革著人們的工作、生活、學(xué)習(xí)等。

但從大模型的商業(yè)化應(yīng)用角度來看,正如前文所說,相比于C端消費(fèi)者,企業(yè)業(yè)務(wù)集成大模型能力需要考慮模型能力、應(yīng)用場景、算力的具體特點(diǎn)。這也是當(dāng)下大模型產(chǎn)業(yè)迭代升級,向商業(yè)化進(jìn)階的重中之重。

大模型玩家的交鋒并沒有停歇,從百模大戰(zhàn)的拼算力、拼參數(shù),如今的大模型已經(jīng)越來越具備實(shí)用屬性。在這背后,既離不開業(yè)務(wù)端企業(yè)對前沿技術(shù)的深入了解,以及勇于探索嘗試,也離不開擁有核心技術(shù)的企業(yè)不斷突圍技術(shù)創(chuàng)新,堅(jiān)定投入。

國內(nèi)大模型核心玩家、企業(yè)、算力商等諸多玩家已被卷入新一波大模型浪潮中,成為大模型商業(yè)化應(yīng)用生態(tài)構(gòu)建的重要參與者,進(jìn)一步彌補(bǔ)國內(nèi)大模型產(chǎn)業(yè)與國外水平的差距。

面向未來,大模型將作為一種必需品,在企業(yè)提升全球競爭力的過程中扮演著關(guān)鍵角色,科大訊飛在AI行業(yè)深耕20余年積累的一系列先發(fā)優(yōu)勢,將成為當(dāng)下其在大模型競爭關(guān)鍵環(huán)節(jié)快人一步的重要支撐。