智東西(公眾號(hào):zhidxcom)
作者?|?程茜
編輯?|?漠影

智東西5月6日?qǐng)?bào)道,今天下午,訊飛星火認(rèn)知大模型發(fā)布,以及大模型在教育、辦公、汽車、數(shù)字員工行業(yè)領(lǐng)域的應(yīng)用成果同步亮相。

同時(shí),科大訊飛還提出了通用人工智能(AGI)在7大維度481項(xiàng)的評(píng)測(cè)體系,這七大維度包括文本生成、語(yǔ)言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力。經(jīng)科大訊飛評(píng)測(cè)對(duì)比,星火認(rèn)知大模型已經(jīng)在文本生成、語(yǔ)言理解、數(shù)學(xué)能力上優(yōu)于ChatGPT。

訊飛星火大模型采用了“1+N”的整體布局,其中“1”是通用認(rèn)知智能大模型,包含7大維度的能力,“N”是大模型在教育、辦公、汽車、數(shù)字員工等多個(gè)行業(yè)領(lǐng)域的應(yīng)用。

科大訊飛董事長(zhǎng)劉慶峰還透露了星火認(rèn)知大模型在2023年的關(guān)鍵里程碑,6月9日,星火認(rèn)知大模型將突破開放式問答,實(shí)現(xiàn)多輪對(duì)話能力再升級(jí)、數(shù)學(xué)能力再升級(jí);8月15日,突破代碼能力、實(shí)現(xiàn)多模態(tài)交互再升級(jí);10月24日,通用大模型要對(duì)標(biāo)ChatGPT能力,實(shí)現(xiàn)中文能力超越、英文能力相當(dāng)?shù)哪繕?biāo)。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

▲科大訊飛董事長(zhǎng)劉慶峰

劉慶峰認(rèn)為,當(dāng)下認(rèn)知大模型已經(jīng)成為通用人工智能的曙光,這一技術(shù)的出現(xiàn)產(chǎn)生的影響不亞于PC或互聯(lián)網(wǎng)的誕生。

一、七大通用能力現(xiàn)場(chǎng)演示,語(yǔ)音輸入、實(shí)時(shí)互動(dòng)

劉慶峰談道,從ChatGPT關(guān)注的48個(gè)主要任務(wù)方向和訊飛開放平臺(tái)上400多萬(wàn)開發(fā)者團(tuán)隊(duì)的需求分析,通用人工智能應(yīng)該具備七大維度能力,分別是文本生成、語(yǔ)言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力等。

因此,現(xiàn)場(chǎng)星火認(rèn)知大模型基于這七大維度進(jìn)行了演示,并且現(xiàn)場(chǎng)輸入完全通過語(yǔ)音轉(zhuǎn)寫文字鍵入需求,無(wú)需打字輸入。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

一開始,星火認(rèn)知大模型就展示了自己名字的由來(lái)。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

1、多風(fēng)格多任務(wù)長(zhǎng)文本生成

首先,星火認(rèn)知大模型為這場(chǎng)發(fā)布會(huì)生成了一篇?dú)g迎詞,“今天是訊飛星火認(rèn)知大模型的發(fā)布會(huì),現(xiàn)場(chǎng)高朋滿座,我們也特別希望和各位朋友們精誠(chéng)合作,共同建設(shè)美好世界。請(qǐng)幫我寫一篇?dú)g迎詞”。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

在故事生成能力上,星火認(rèn)知大模型也毫不遜色,“在今天的訊飛星火認(rèn)知大模型的發(fā)布會(huì)上,孫悟空和奧特曼也偷偷潛入了現(xiàn)場(chǎng),他們都搶著想做星火大模型的發(fā)言人,還為此吵了一架,根據(jù)上述信息來(lái)創(chuàng)作一個(gè)故事”。

星火認(rèn)知大模型不僅將孫悟空和奧特曼的相關(guān)情節(jié)描述得十分生動(dòng),還在故事中引入了另一個(gè)主要人物“一位白發(fā)蒼蒼的老者”來(lái)保證故事情節(jié)的完整性。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

星火還能幫助用戶起草工作郵件,如“幫我寫一封內(nèi)部工作郵件發(fā)給訊飛翻譯機(jī)團(tuán)隊(duì),針對(duì)五一的銷售計(jì)劃,明天上午9點(diǎn)在201會(huì)議室討論訊飛翻譯機(jī)4.0新品的營(yíng)銷計(jì)劃和產(chǎn)品功能”。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

此外,在多語(yǔ)言生成中,星火還可以快速生成“英文的訊飛翻譯機(jī)4.0新品品宣文案”。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

有趣的是,當(dāng)你將文案發(fā)布情境設(shè)定到小紅書時(shí),星火也可以快速轉(zhuǎn)換語(yǔ)言風(fēng)格重新生成文本。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

劉慶峰說(shuō),經(jīng)過評(píng)測(cè),訊飛星火認(rèn)知大模型的中文語(yǔ)言理解能力已經(jīng)超過ChatGPT,在英文理解能力上,ChatGPT的能力達(dá)到4.48分,星火認(rèn)知大模型為4.29分。

2、多層次跨語(yǔ)種語(yǔ)言理解

針對(duì)英文文案,星火還可以快速對(duì)其進(jìn)行語(yǔ)法檢查和糾錯(cuò)。劉慶峰透露,對(duì)于英文語(yǔ)法、句式的糾錯(cuò)能力,星火認(rèn)知大模型已經(jīng)做到業(yè)界最強(qiáng)。

當(dāng)面對(duì)一些模棱兩可的話語(yǔ)需要大模型更高層次的理解能力時(shí),星火認(rèn)知大模型也可以準(zhǔn)確剖析其不同含義。如“俗話說(shuō)男子漢大丈夫要寧死不屈,俗話又說(shuō),男子漢大丈夫能屈能伸,這兩種說(shuō)法應(yīng)該怎么理解”。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

放到具體情境中,“如果有個(gè)小伙子和女朋友吵架了,他應(yīng)該寧死不屈還是能屈能伸”,星火也可以準(zhǔn)確回復(fù)。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

對(duì)于一些文字表意一樣,但含義不同的詞語(yǔ),如“今天小明參加比賽拿到冠軍,他拿著獎(jiǎng)杯默默地站了一分鐘,今天我被老師批評(píng)了,走出教室后我默默地站了一分鐘,請(qǐng)問上面這兩個(gè)‘默默地站了一分鐘’,分別表達(dá)了什么樣的心情?”

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

星火還可以使用上面“默默地站了一分鐘”組詞,并且能根據(jù)具體需求生成相應(yīng)句子。重新生成后,星火也會(huì)輸出完全不同的幾個(gè)句子。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

可以看出,星火是確實(shí)理解了文字背后的含義再進(jìn)行文本輸出。

對(duì)于語(yǔ)言理解能力,劉慶峰透露, 和國(guó)內(nèi)可測(cè)的現(xiàn)有系統(tǒng)相比,星火認(rèn)知大模型明顯遙遙領(lǐng)先,與ChatGPT有細(xì)微差距。

3、泛領(lǐng)域開放式知識(shí)問答

飲食類問題中,當(dāng)詢問“菠菜和豆腐能不能一起吃”,星火給出了專業(yè)的答案。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

在科技領(lǐng)域,星火也能應(yīng)對(duì)“量子科技主要有哪些應(yīng)用領(lǐng)域?”的問題。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

當(dāng)將兩個(gè)不同的概念放到一起,如“量子糾纏和心靈感應(yīng)是不是一回事”,星火也沒有被繞暈。劉慶峰透露,在中國(guó)科學(xué)院的支持下,星火仍在持續(xù)學(xué)習(xí)科技領(lǐng)域的知識(shí)。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

對(duì)于專業(yè)性更強(qiáng)的醫(yī)療領(lǐng)域,當(dāng)問及“如果家中老人突然暈倒,如何判斷是不是中風(fēng)?”,星火給出了四個(gè)判斷的維度。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

當(dāng)追問“能不能馬上把他扶到床上去休息”,星火也提出了專業(yè)的建議。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

劉慶峰談道,目前在醫(yī)療治理方面,科大訊飛智醫(yī)助理的能力比GPT-4要強(qiáng)很多,但由于醫(yī)療領(lǐng)域?qū)I(yè)性的更高要求,這一方面能力的開放需要更加謹(jǐn)慎,將于今年訊飛1024開發(fā)者節(jié)期間正式發(fā)布。訊飛的目標(biāo)是讓星火大模型不僅要成為醫(yī)生的診療助手,還能成為每個(gè)人的健康助手。

4、情境式思維鏈邏輯推理

當(dāng)提問“孔子在2008年的奧運(yùn)會(huì)上說(shuō)了什么?”,星火可以快速理解“孔子不可能出現(xiàn)在2008年的奧運(yùn)會(huì)上”。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

換一個(gè)風(fēng)格后,星火還能編出“孔子在2008年奧運(yùn)會(huì)上給大家做漢語(yǔ)培訓(xùn)”的故事。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

面對(duì)更復(fù)雜的邏輯問題,“當(dāng)黃兔、黑兔、白兔在賽跑,黑兔說(shuō)自己跑的不是最快,但比白兔快,誰(shuí)跑的最快,誰(shuí)跑的最慢”,涉及三個(gè)主體的推理問題時(shí),星火第一次生成的答案在“誰(shuí)跑的最快”上出現(xiàn)了偏差。重新生成后,星火也快速給出了正確答案。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

5、多題型可解析數(shù)學(xué)能力

在一些容易混淆的數(shù)字問題上,如“某個(gè)公司的股票昨天漲了10%,今天又跌了10%,請(qǐng)問到底是漲了還是跌了”,星火也沒有被難倒。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

幾何問題中,但問到“等腰三角形的底角是頂角的兩倍,這一三角形的角度是多少”,星火給出了下面的答案:

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

6、多功能多語(yǔ)言代碼能力

目前星火的代碼生成能力是針對(duì)工業(yè)互聯(lián)網(wǎng)、企業(yè)內(nèi)部的應(yīng)用。

當(dāng)問到“用代碼找出1到100之內(nèi)的所有質(zhì)數(shù)”,星火輸出了Python代碼實(shí)現(xiàn)過程和最終結(jié)果。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

7、多模態(tài)輸入和表達(dá)能力不斷豐富

在多模態(tài)能力上,星火可以把圖片中的英文翻譯成中文。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

并且,星火還可以化身一個(gè)美食助手,可以回答每道菜是什么口味等問題。大模型的加持下,星火可以從簡(jiǎn)單的文字到文字翻譯變?yōu)槲淖值綄?dǎo)游角色的升級(jí)。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

文字輸出方面,星火以立夏為主題,生成了一篇200字左右的散文。同時(shí),星火還支持用語(yǔ)音、虛擬人合成輸出音頻和視頻。在視頻中,不僅有女生的虛擬人形象,還有相對(duì)應(yīng)的背景畫面、虛擬人手勢(shì)隨著文字內(nèi)容變化。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

劉慶峰透露,多模態(tài)輸入和表達(dá)目前還沒有開放,這一能力將在8月份開放給VIP客戶使用。

演示現(xiàn)場(chǎng)還有現(xiàn)場(chǎng)隨機(jī)抽取問題回答環(huán)節(jié),針對(duì)于一些奇奇怪怪的問題,星火認(rèn)知大模型也沒有被難到。包括外星人感冒了需要戴口罩嗎?我想把四十平的房子裝修成七十平的感覺等。

在輸出的答案中,星火大模型會(huì)對(duì)問題場(chǎng)景進(jìn)行一些限制,考慮到多個(gè)場(chǎng)景來(lái)使得回答更為準(zhǔn)確。劉慶峰說(shuō),星火大模型在不斷的進(jìn)步過程中,很多答案也會(huì)超出他們的預(yù)期。

二、落地四大應(yīng)用領(lǐng)域,星星之火“燎原”教育、辦公、汽車、數(shù)字員工

除了強(qiáng)大的通用能力外,星火認(rèn)知大模型也已經(jīng)在實(shí)實(shí)在在的產(chǎn)業(yè)場(chǎng)景中實(shí)現(xiàn)了應(yīng)用落地,包括教育、辦公、汽車和數(shù)字員工四大領(lǐng)域。

1、教育:批改中英文作文能力升級(jí),形成批改、修訂、學(xué)習(xí)閉環(huán)

訊飛AI學(xué)習(xí)機(jī)已經(jīng)可以精準(zhǔn)分析每個(gè)學(xué)生的薄弱環(huán)節(jié),并在五萬(wàn)多所中小學(xué)校實(shí)現(xiàn)應(yīng)用。此次,星火大模型也再次將學(xué)習(xí)機(jī)的語(yǔ)言學(xué)習(xí)能力升級(jí)。

此前,老師對(duì)一個(gè)學(xué)生的作文進(jìn)行精批大概要花費(fèi)半個(gè)小時(shí)時(shí)間,批改完一個(gè)班的學(xué)生會(huì)付出大量的時(shí)間成本。

在演示中,星火認(rèn)知大模型針對(duì)小學(xué)四年級(jí)上冊(cè)第八單元的作文“我的心兒怦怦跳”的寫作要素和寫作要求進(jìn)行批改。

學(xué)習(xí)機(jī)批改的過程包括錯(cuò)別字、語(yǔ)句、內(nèi)容,最后會(huì)生成批改評(píng)價(jià)以及寫作建議,并且用戶點(diǎn)擊錯(cuò)別字還能看到相應(yīng)的知識(shí)卡片。

批改修訂建議還會(huì)用不同顏色區(qū)分,紅色代表不符合某一條寫作要求,綠色代表符合寫作要求,此外,學(xué)習(xí)機(jī)還給出了優(yōu)化參考內(nèi)容。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

在英文作文批改方面,學(xué)習(xí)機(jī)會(huì)批改單詞拼寫、詞匯用法、句型結(jié)構(gòu),最后同樣會(huì)給出內(nèi)容評(píng)價(jià)。

并且,學(xué)習(xí)機(jī)在作文有錯(cuò)誤的地方會(huì)給出相對(duì)應(yīng)的學(xué)習(xí)資料,完成基礎(chǔ)批改、高級(jí)批改、提示建議、優(yōu)化參考的閉環(huán)過程。

劉慶峰談道:“這在業(yè)界是0到1的突破。”搭載大模型的訊飛AI學(xué)習(xí)機(jī)在批改、修訂等的準(zhǔn)確率上已經(jīng)超過了一般老師的平均水平。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

口語(yǔ)和聽說(shuō)能力上,訊飛AI學(xué)習(xí)機(jī)可以在家庭里為用戶營(yíng)造一個(gè)真實(shí)的對(duì)話環(huán)境,例如針對(duì)“最愛的季節(jié)”這一開放式問答,訊飛學(xué)習(xí)機(jī)能夠和用戶實(shí)現(xiàn)類人對(duì)話。

并且英文口語(yǔ)對(duì)話中,如果用戶有不會(huì)說(shuō)的單詞,可以用中文表述,星火認(rèn)知大模型也能理解。

劉慶峰稱,這一功能今天已經(jīng)在訊飛AI學(xué)習(xí)機(jī)上T20 Pro開放,此前已購(gòu)買該設(shè)備的用戶可以在線下載更新獲得功能。訊飛AI學(xué)習(xí)機(jī)上T20 Pro也是全球首款搭載大模型的AI學(xué)習(xí)機(jī)。

2、辦公:快速生成紀(jì)要、摘要,音頻能一鍵轉(zhuǎn)化新聞稿件

訊飛此次通過星火大模型對(duì)辦公產(chǎn)品進(jìn)行了升級(jí),包括訊飛智能辦公本、錄音筆、訊飛聽見、智能麥克風(fēng)。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

現(xiàn)場(chǎng)劉慶峰講述了會(huì)議場(chǎng)景下,用戶往往有記不全、找不到、對(duì)數(shù)據(jù)安全性擔(dān)憂幾大痛點(diǎn)。智能辦公本可以通過語(yǔ)音轉(zhuǎn)文字、字音同步、離線模式錄音轉(zhuǎn)寫的方式解決上述痛點(diǎn)。

搭載大模型的智能辦公本針對(duì)上述內(nèi)容快速生成了會(huì)議紀(jì)要,不僅包含文本摘要,還結(jié)合了用戶的手寫筆記。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

在一些演講場(chǎng)景下,演講嘉賓的口語(yǔ)表達(dá)會(huì)和書面成稿內(nèi)容有較大差距,智能辦公本可以將重復(fù)的語(yǔ)氣詞去掉并保留演講中的關(guān)鍵信息,同時(shí)調(diào)整口語(yǔ)語(yǔ)序,使其讀起來(lái)更加通順。

劉慶峰介紹道,語(yǔ)篇規(guī)整能力可以實(shí)現(xiàn)原文忠實(shí)度保留96%以上,原文篇幅縮小40%-60%,閱讀效率提升50%以上。

訊飛智能辦公本X2也是業(yè)界首個(gè)搭載大模型的智能辦公硬件,同樣,用戶可以免費(fèi)下載更新相關(guān)功能。他補(bǔ)充說(shuō),后續(xù)訊飛也會(huì)將大模型搭載到辦公的全系列產(chǎn)品上。

同時(shí),訊飛聽見還支持一鍵成稿,用戶導(dǎo)入音頻后,就可以立即生成新聞稿件、品宣文案、工作總結(jié)、工作計(jì)劃、工作待辦等。

演示中,星火接收到一段音頻文件后,先進(jìn)行了音頻轉(zhuǎn)寫,再根據(jù)用戶需求生成相應(yīng)的文稿。同時(shí),當(dāng)用戶輸入了想要在這篇“新聞稿件”中涉及的關(guān)鍵信息后,智能辦公本會(huì)將標(biāo)題、內(nèi)容重新生成,并重點(diǎn)突出描述這一關(guān)鍵信息。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

劉慶峰說(shuō),現(xiàn)在登陸訊飛聽見的官網(wǎng)可以馬上運(yùn)用這些功能。除此以外,訊飛智能錄音筆SR702和訊飛智能麥克風(fēng)M2也升級(jí)了會(huì)議紀(jì)要、語(yǔ)篇調(diào)整、一鍵成稿功能。

3、汽車:人車對(duì)話更加智能,汽車上也能訂餐、購(gòu)票

科大訊飛汽車座艙人機(jī)交互系統(tǒng)可以提供多輪、多人、多區(qū)域、多模態(tài)的智能汽車人機(jī)交互范式,在星火大模型的加持下,這一交互模式可以讓用戶在車上的對(duì)話更加自由、更人性化、更懂汽車、更加開放。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

同時(shí),星火大模型還支持各種插件在汽車場(chǎng)景下與之行結(jié)合,如汽車的導(dǎo)航、餐飲、購(gòu)票等功能都可以用星火大模型實(shí)現(xiàn)。

在演示視頻中,用戶可以和汽車上的人機(jī)交互系統(tǒng)對(duì)話,詢問旅游計(jì)劃、避開節(jié)假日人流密集的旅游路線、生成故事、接聽電話等。

劉慶峰說(shuō),這樣一來(lái),汽車上的體驗(yàn)和原來(lái)會(huì)完全不同,人們?cè)谄嚴(yán)锷?、工作的效率也?huì)上一個(gè)臺(tái)階。

4、數(shù)字員工:生成式自動(dòng)RPA,自然語(yǔ)言自動(dòng)生成業(yè)務(wù)流程

此前,科大訊飛虛擬人智能交互機(jī)可以通過虛擬形象,以對(duì)話的形式扮演導(dǎo)游、虛擬客服、醫(yī)院導(dǎo)診、志愿者服務(wù)等角色,這些更人性化的交互機(jī)也大幅提高了各行業(yè)的工作效率。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

在演示過程中,基于星火認(rèn)知大模型的生成式RPA能夠讓工作人員通過自然語(yǔ)言輸入,大模型去理解員工通過自然語(yǔ)言描述的需求,自動(dòng)生成業(yè)務(wù)流程和可執(zhí)行的RPA能力清單,并調(diào)度RPA的執(zhí)行能力實(shí)現(xiàn)流程自動(dòng)化的運(yùn)行。

這一能力在人力資源領(lǐng)域的應(yīng)用也已經(jīng)在訊飛內(nèi)部實(shí)現(xiàn)場(chǎng)景落地。

劉慶峰透露,下一步,訊飛星火認(rèn)知大模型還會(huì)賦能城市、工業(yè)等各個(gè)行業(yè)。

三、應(yīng)用落地引領(lǐng)者,用評(píng)測(cè)體系指明大模型發(fā)展前路

作為國(guó)內(nèi)人工智能領(lǐng)域國(guó)家隊(duì),科大訊飛早在2011年就肩負(fù)起語(yǔ)音及語(yǔ)言處理國(guó)家工程實(shí)驗(yàn)室的重任。

2014年,科大訊飛推出“訊飛超腦計(jì)劃”,明確提出要讓機(jī)器像人一樣具備能理解會(huì)思考的能力,2022年,這一計(jì)劃升級(jí)為“訊飛超腦2030計(jì)劃”,提出讓懂知識(shí)、善學(xué)習(xí)、能進(jìn)化的通用人工智能技術(shù)成為每個(gè)人未來(lái)發(fā)展的重要機(jī)會(huì),讓機(jī)器人走進(jìn)家庭。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

星火認(rèn)知智能大模型也是這一計(jì)劃的重要一環(huán)。劉慶峰談道,在科學(xué)常識(shí)推理能力中,單模型已經(jīng)超過了人類平均水平。

事實(shí)上,去年11月30日ChatGPT發(fā)布會(huì),科大訊飛就迅速進(jìn)行了相關(guān)技術(shù)和研發(fā)體系驗(yàn)證,12月15日啟動(dòng)了認(rèn)知智能大模型的“1+N”專項(xiàng)攻關(guān)。

他認(rèn)為,想要讓這一次智慧涌現(xiàn)的認(rèn)知智能真的解決社會(huì)剛需,要建立一套實(shí)實(shí)在在的科學(xué)系統(tǒng)的評(píng)測(cè)體系,來(lái)告訴這個(gè)行業(yè)“技術(shù)發(fā)展到了什么程度、下一個(gè)發(fā)展趨勢(shì)應(yīng)該往哪邊走?”

因此,科大訊飛與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長(zhǎng)三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類481個(gè)細(xì)分任務(wù)類型的科學(xué)系統(tǒng)評(píng)測(cè)體系。

訊飛版大模型來(lái)了!首發(fā)通用人工智能評(píng)測(cè)體系,三大能力不輸ChatGPT

當(dāng)下,劉慶峰也談道,純大模型技術(shù)有很多待攻克的技術(shù)缺陷,如對(duì)新知識(shí)難以及時(shí)更新、事實(shí)類問題容易發(fā)生張冠李戴的現(xiàn)象等。

但對(duì)于這些,訊飛都有非常明確的解決方案。他透露在科大訊飛成立24周年之際,星火大模型要突破開放式問答,類搜索插件可以全部知道新知識(shí),通過多輪對(duì)話進(jìn)行升級(jí),數(shù)學(xué)能力再上一個(gè)新的臺(tái)階。

這都得益于科大訊飛此前在人工智能領(lǐng)域的技術(shù)積累,以及在認(rèn)知智能領(lǐng)域取得的領(lǐng)先成果。如2017年科大訊飛讓機(jī)器在全球首次通過國(guó)家職業(yè)醫(yī)師資格考試、超過了96.3%參加考試的醫(yī)生,并且在SQuAD機(jī)器閱讀理解中全球首次超過人類平均水平,2022年在OpenBookQA科學(xué)知識(shí)推理中,單模型也超過人類平均水平。

作為將大模型率先應(yīng)用落地的玩家,科大訊飛還通過訊飛開放平臺(tái)開放了560項(xiàng)AI能力,并且有首批來(lái)自36個(gè)行業(yè)的3000余家企業(yè)開發(fā)者將接入星火大模型?;诖?,科大訊飛將聯(lián)合行業(yè)合作伙伴共建大模型“星火”生態(tài),讓大模型能真正落地到行業(yè)中去。

結(jié)語(yǔ):訊飛打響大模型應(yīng)用落地“第一槍”!

大模型的真正價(jià)值在于成為生產(chǎn)力工具,使得產(chǎn)業(yè)應(yīng)用真正與前沿技術(shù)相結(jié)合。當(dāng)下,大模型也已經(jīng)進(jìn)入產(chǎn)業(yè)落地的關(guān)鍵期。

科大訊飛此前在認(rèn)知智能領(lǐng)域的技術(shù)積累優(yōu)勢(shì),以及在教育、辦公等場(chǎng)景下的深耕使得其成為大模型應(yīng)用落地的率先突破者。

同時(shí),AI新的技術(shù)革命已經(jīng)到來(lái),正在對(duì)各行各業(yè)產(chǎn)生深遠(yuǎn)影響,訊飛星火大模型的應(yīng)用成果發(fā)布將進(jìn)一步助攻大模型AI技術(shù)在各行各業(yè)的規(guī)?;占啊?/p>