智東西(公眾號(hào):zhidxcom)
編輯 | GTIC

智東西4月18日?qǐng)?bào)道,在剛剛落幕的GTIC 2023中國(guó)AIGC創(chuàng)新峰會(huì)上,云知聲聯(lián)合創(chuàng)始人兼副總裁李霄寒帶來(lái)了名為《從理解到生成,云知聲的AGI之路》的主題演講。

李霄寒通過(guò)回顧過(guò)去近30年AI的發(fā)展歷程,總結(jié)出了AI演進(jìn)3點(diǎn)規(guī)律。首先,AI的演進(jìn)從以算法為中心逐步變?yōu)橐阅P蜑橹行模@將影響科技企業(yè)未來(lái)在相關(guān)資源上的投入比例;其次,AI項(xiàng)目逐漸從小而美的工程變?yōu)橐豁?xiàng)大工程,如果一家科技企業(yè)過(guò)去沒(méi)有AI相關(guān)的積累,而未來(lái)又沒(méi)有大規(guī)模的投入的話(huà),那么發(fā)展起來(lái)是非常困難的;最后,AI在解決復(fù)雜任務(wù)時(shí),將通過(guò)端到端的方式,中間任務(wù)將面臨凋零。

李霄寒認(rèn)為,ChatGPT的推出,對(duì)當(dāng)下AI技術(shù)路線(xiàn)、社會(huì)分工以及AI企業(yè)發(fā)展產(chǎn)生深遠(yuǎn)影響。在技術(shù)路線(xiàn)層面上,此前,雖然國(guó)內(nèi)外的許多家科技企業(yè)認(rèn)為實(shí)現(xiàn)通用人工智能(AGI)需要一個(gè)“線(xiàn)性輸入——線(xiàn)性輸出”的過(guò)程,但是這家企業(yè)對(duì)這條路徑信心不足。ChatGPT驗(yàn)證了這條路徑的可行性,即只要持續(xù)地線(xiàn)性投入,那么當(dāng)模型參數(shù)達(dá)到一定規(guī)模時(shí),就可能出現(xiàn)涌現(xiàn)效應(yīng)。

在社會(huì)分工層面,李霄寒指出,未來(lái)從事文稿撰寫(xiě)、客服、兒童成長(zhǎng)陪伴師這樣的崗位將會(huì)被淘汰,因?yàn)檫@些崗位實(shí)際上只是在做一些簡(jiǎn)單的輸入輸出工作。在AI企業(yè)發(fā)展上,李霄寒展望了未來(lái)兩種不同模式下的AI企業(yè)生態(tài)。其中一種是基于通用大模型的公司,它們通過(guò)通用大模型底座對(duì)外提供服務(wù),從而獲取規(guī)模性的用戶(hù),另一種是基于垂直場(chǎng)景大模型提供精細(xì)化服務(wù)的公司,這種公司的大模型可能達(dá)到幾百億參數(shù)的規(guī)模。

最后,李霄寒分析了ChatGPT的進(jìn)步性以及局限性所在。他認(rèn)為,ChatGPT的出現(xiàn),讓AI真正進(jìn)入了CGG時(shí)代。這不僅體現(xiàn)在人類(lèi)有機(jī)會(huì)告別人工智障,還體現(xiàn)在AGI有望成為現(xiàn)實(shí)。但ChatGPT目前生成的信息并不完全準(zhǔn)確,同時(shí)知識(shí)更新和自動(dòng)化的程度不夠。

以下為李霄寒的演講實(shí)錄:

非常榮幸有機(jī)會(huì)來(lái)跟大家做一下分享,云知聲是一家AI公司,也是這波ChatGPT的浪潮下最受關(guān)注的公司類(lèi)型之一。大家紛紛關(guān)心我們這種AI公司在想什么、做什么。同時(shí),也有人在問(wèn),這波浪潮會(huì)對(duì)AI公司有什么影響?AI公司將如何破局?

簡(jiǎn)單來(lái)講,云知聲是一家垂直類(lèi)的AI公司,它有兩方面業(yè)務(wù),分別是智慧物聯(lián)和智慧醫(yī)療。近期我們會(huì)推出醫(yī)療版的預(yù)訓(xùn)練大模型,因?yàn)檫@件事情還正在進(jìn)行中,所以我今天沒(méi)有太多關(guān)于這件事情的分享。我還是更多講一下關(guān)于AI從業(yè)者、AI公司如何看待最近這波ChatGPT浪潮。我們可以從中總結(jié)一些規(guī)律、展望一下未來(lái),同時(shí)看一下這波浪潮將會(huì)帶來(lái)哪些機(jī)會(huì),以及存在哪些風(fēng)險(xiǎn)。

一、AI歷史回顧與3大規(guī)律總結(jié)

首先,我們來(lái)回顧一下,AI在過(guò)去近三十年間的重大事件。自我從業(yè)以來(lái),云知聲整個(gè)創(chuàng)始團(tuán)隊(duì)碰到的第一個(gè)、也是最重大的事件就是,1997年,IBM開(kāi)發(fā)的象棋電腦,也就是我們熟知的深藍(lán)計(jì)算機(jī)擊敗了世界圍棋冠軍卡斯帕羅(Гарри Кимович Каспаров)。

2012年,AlexNet橫掃ImageNet的榜單,讓人認(rèn)識(shí)到深度神經(jīng)網(wǎng)絡(luò)的力量,那一年,云知聲把深度神經(jīng)網(wǎng)絡(luò)應(yīng)用在語(yǔ)音方面,并且達(dá)到了當(dāng)時(shí)普通話(huà)的最佳水平。

2016年,AlphaGo打破人類(lèi)圍棋不可戰(zhàn)勝的神話(huà),在那一年,云知聲完成了過(guò)去幾年比較基礎(chǔ)的技術(shù)積累,并且在那個(gè)時(shí)間點(diǎn)形成了一直延續(xù)至今并且還在不斷發(fā)展壯大的兩大業(yè)務(wù)——智慧物聯(lián)和智慧醫(yī)療。

最近OpenAI推出了ChatGPT,一方面,我們感受到了巨大的壓力,另一方面,我們也感到非常欣喜——從業(yè)這么多年,終于有機(jī)會(huì)真正看到AGI在未來(lái)幾年成為現(xiàn)實(shí)。所以云知聲也積極地融入到整個(gè)大模型浪潮之中。

回顧歷史,我總結(jié)了AI演進(jìn)的3點(diǎn)規(guī)律。首先,AI的演進(jìn)將從以算法為中心逐步變到以模型為中心。早些年的專(zhuān)家系統(tǒng)基本上都是規(guī)則。上世紀(jì)90年代,統(tǒng)計(jì)學(xué)習(xí)模型興盛以后,模型逐步開(kāi)始占比較大的比重,拿典型的語(yǔ)言識(shí)別關(guān)鍵詞檢測(cè)任務(wù)來(lái)講,原代碼的大小和模型大小基本在同一個(gè)量級(jí),現(xiàn)在看來(lái)像一個(gè)玩具。而隨著深度學(xué)習(xí)模型的引入以及到最近預(yù)訓(xùn)練模型引入,整個(gè)模型占的比重越來(lái)越大,這就導(dǎo)致我們的投入——資源、人力、硬件以及比例跟過(guò)去相比完全不一樣。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

第二個(gè)規(guī)律,AI項(xiàng)目逐漸從小而美的工程變成大工程。在過(guò)去的5年或者10年前,一家企業(yè)找?guī)讉€(gè)人搭一個(gè)班子,買(mǎi)一些服務(wù)器數(shù)據(jù)就可以做出一個(gè)AI產(chǎn)品,這個(gè)AI產(chǎn)品可以面向某個(gè)特定場(chǎng)景解決一些特定問(wèn)題。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

在未來(lái),這件事情將會(huì)變得不可行。AI真正變成一個(gè)大工程。雖然還會(huì)有人想找一個(gè)非常小的領(lǐng)域去做AI,但是問(wèn)題是,當(dāng)這個(gè)大模型解決完所有通用的問(wèn)題之后,只需要在上面延伸出一個(gè)垂直就可以把原來(lái)辛辛苦苦做的東西顛覆掉?,F(xiàn)在,一家企業(yè)如果在AI領(lǐng)域沒(méi)有一定的積累,未來(lái)又沒(méi)有大規(guī)模投入的話(huà),那么發(fā)展AI還是比較困難的。

第三個(gè)規(guī)律,就是中間任務(wù)的凋零。過(guò)去AI解決一個(gè)復(fù)雜問(wèn)題的時(shí)候,會(huì)把這個(gè)任務(wù)劃分成一系列子任務(wù),然后再把它們串起來(lái)。這樣一來(lái),前一個(gè)子任務(wù)的輸出可能只是為了下一個(gè)子任務(wù)的輸入,這是所謂的中間任務(wù)。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

2000年前后,手寫(xiě)識(shí)別功能特別流行。當(dāng)用戶(hù)在手機(jī)上用手寫(xiě)輸入,AI就可以從一張?jiān)紙D片里面提取出相應(yīng)的特征,然后再將這個(gè)特征輸入到后面的分類(lèi)器中從而實(shí)現(xiàn)手寫(xiě)輸入的功能。但現(xiàn)在,大家都是通過(guò)端到端的方式來(lái)實(shí)現(xiàn),未來(lái)人們將用大模型來(lái)實(shí)現(xiàn)。這種中間任務(wù)慢慢就沒(méi)有人做了,或者說(shuō),這種中間任務(wù)沒(méi)有存在的意義了。類(lèi)似的中間任務(wù)里面還有NLP里面的分詞、指代識(shí)別等等,這些都將被弱化或者消失。

這里面也延伸出一個(gè)有趣的問(wèn)題。ChatGPT輸入、輸出都是文字,其實(shí)文字本身是人類(lèi)對(duì)整個(gè)物理世界翻譯以后形成的符號(hào)系統(tǒng)。這種符號(hào)系統(tǒng)仍然被看作是一項(xiàng)中間任務(wù),那么ChatGPT這種文字類(lèi)的輸入輸出是不是也只是一種中間任務(wù)呢?這是一個(gè)開(kāi)放性話(huà)題,還有待大家的討論。

二、ChatGPT對(duì)當(dāng)下技術(shù)路線(xiàn)、社會(huì)分工、AI企業(yè)之影響

事實(shí)上,ChatGPT還對(duì)當(dāng)下AI的技術(shù)路線(xiàn)、社會(huì)分工以及AI企業(yè)發(fā)展產(chǎn)生重要影響。首先,從對(duì)技術(shù)路線(xiàn)的影響上來(lái)看,2022年及以前,國(guó)內(nèi)的AI公司或者大廠(chǎng)都在做大模型,但是可能各家公司可能沒(méi)有那么強(qiáng)的信心。ChatGPT對(duì)國(guó)內(nèi)的最大影響,就是驗(yàn)證了這條路的可行性,告訴各家公司:只要你線(xiàn)性持續(xù)投入,模型參數(shù)達(dá)到一定規(guī)模就會(huì)獲得涌現(xiàn)效應(yīng),實(shí)現(xiàn)非線(xiàn)性的、爆炸式的輸出。它讓所有人相信大模型是AGI的必經(jīng)之路。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

在社會(huì)分工層面,我們將項(xiàng)目經(jīng)理提交的有關(guān)項(xiàng)目進(jìn)度的一封郵件交給ChatGPT重新組織一下,我發(fā)現(xiàn):組織以后的文本文筆特別流暢、精簡(jiǎn)、結(jié)構(gòu)鮮明,而且重點(diǎn)突出、沒(méi)有廢話(huà)。對(duì)比來(lái)看,項(xiàng)目經(jīng)理提交的項(xiàng)目進(jìn)度書(shū)中廢話(huà)還是蠻多的。這就讓我自然而然地產(chǎn)生一個(gè)問(wèn)題:項(xiàng)目經(jīng)理這樣的角色未來(lái)在我們的公司是不是還會(huì)存在?

我的思路是,要看他為什么負(fù)責(zé)。我認(rèn)為,項(xiàng)目經(jīng)理應(yīng)該為項(xiàng)目的進(jìn)度負(fù)責(zé),并不是為周報(bào)負(fù)責(zé),周報(bào)只是一個(gè)中間任務(wù),被替代掉沒(méi)有關(guān)系。大模型的輸出這種功能可能最終會(huì)去服務(wù)于項(xiàng)目經(jīng)理,而不是替代項(xiàng)目經(jīng)理。

當(dāng)下,“程序員被替代”的消息頻頻引爆互聯(lián)網(wǎng)。我對(duì)程序員的看法與對(duì)項(xiàng)目經(jīng)理的看法相同。程序員并不是為輸出代碼負(fù)責(zé),他負(fù)責(zé)的是功能的正常集成,以及集成后的正常運(yùn)行,他為debug(計(jì)算機(jī)排除故障)負(fù)責(zé),而所謂代碼只是一種中間任務(wù)。

未來(lái),云知聲的開(kāi)發(fā)體系里,產(chǎn)品經(jīng)理、項(xiàng)目經(jīng)理、架構(gòu)師、編碼、集成、運(yùn)維等等,每個(gè)人都將獲得大模型的輔助。同時(shí),我認(rèn)為,未來(lái)從事文稿撰寫(xiě)、客服、兒童成長(zhǎng)陪伴師這樣的崗位將會(huì)被淘汰,因?yàn)檫@些崗位實(shí)際上只是在做一些簡(jiǎn)單的輸入輸出工作。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

在AI企業(yè)發(fā)展上,我認(rèn)為,未來(lái)將會(huì)有兩種不同模式下的AI企業(yè)生態(tài)。其中一種是基于通用大模型的公司,它們通過(guò)通用大模型底座對(duì)外提供服務(wù),從而獲取規(guī)模性的用戶(hù)。除此之外,由于這種服務(wù)的成本會(huì)較低,最后它的售價(jià)也會(huì)非常低。

另一種是基于垂直場(chǎng)景大模型提供精細(xì)化服務(wù)的公司,我堅(jiān)信,通用的大模型并不能解決垂直領(lǐng)域的所有問(wèn)題,哪怕它在技術(shù)上解決掉,在真正的應(yīng)用過(guò)程中,還會(huì)有很多行業(yè)壁壘。所以云知聲希望成為這種基于垂直場(chǎng)景大模型提供精細(xì)化服務(wù)的公司。但目前,云知聲還沒(méi)有那么大參數(shù)規(guī)模的模型,一開(kāi)始的時(shí)候,云知聲的大模型可能不會(huì)到千億參數(shù)級(jí)別,但一定會(huì)在百億參數(shù)級(jí)別,那樣也將會(huì)有涌現(xiàn)效應(yīng)存在。

三、理性分析:ChatGPT的進(jìn)步與局限

下面,我將簡(jiǎn)單談一下ChatGPT的進(jìn)步性與局限性所在。ChatGPT的出現(xiàn),讓AI真正進(jìn)入了CGG時(shí)代。所謂CGG,第一個(gè)指的是會(huì)話(huà)式AI,ChatGPT讓我們有機(jī)會(huì)告別人工智障,這給我們帶來(lái)了非常大的興奮點(diǎn)。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

第二個(gè)是生成式AI,語(yǔ)音、文字、圖像,視頻皆可生成;第三個(gè)就是AGI,我們將有幸看到,AGI在未來(lái)幾年真正成為現(xiàn)實(shí),然后從這個(gè)時(shí)間點(diǎn)往后,巨量的投資也好,或者AI企業(yè)的人員投入也好,都會(huì)集中在AGI層面。

ChatGPT當(dāng)然也存在一些局限,我們關(guān)注這些局限不是為了挑毛病,而是去反思在我們所從事的領(lǐng)域如何解決這些問(wèn)題,避免這些問(wèn)題。

第一是“幻覺(jué)”,就是所謂的一本正經(jīng)地胡說(shuō)八道;第二是知識(shí)更新的速度和自動(dòng)化的程度,當(dāng)我們?nèi)プ龃怪眻?chǎng)景的時(shí)候,存在大量的行業(yè)知識(shí),這些行業(yè)知識(shí)在不斷地產(chǎn)出,我們也需要迅速地吸收,讓它被搜索到,另外在To B場(chǎng)景中,我們需要賦予客戶(hù)本身一定的能力,讓其能夠自己“灌知識(shí)”,而不是所有事情都依賴(lài)服務(wù)公司;第三是推理資源的微型化,也就是私有化;第四是倫理和價(jià)值觀(guān)的問(wèn)題,這個(gè)問(wèn)題通過(guò)前置或者后置審查,相對(duì)可控。

最后是ChatGPT學(xué)習(xí)及處理的僅僅是人類(lèi)世界從現(xiàn)實(shí)世界翻譯來(lái)的符號(hào)化知識(shí),缺乏與物理世界的互動(dòng)。這個(gè)問(wèn)題是相對(duì)比較長(zhǎng)遠(yuǎn)的一個(gè)方向,但它也是我們解決上述問(wèn)題之后,必須面臨的下一個(gè)問(wèn)題。

四、云知聲的AGI路徑展望

云知聲于2012年成立,公司擁有自研的技術(shù)架構(gòu),包括自建的超算中心、全棧式算法,以及這么多年積累的海量數(shù)據(jù)。云知聲一開(kāi)始是用AI 1.0的方式在做云知大模型,現(xiàn)在正將其進(jìn)化到預(yù)訓(xùn)練大模型的方式。

云知聲下游覆蓋智慧物聯(lián)與智慧醫(yī)療兩大場(chǎng)景,未來(lái)會(huì)從智慧醫(yī)療入手,應(yīng)用我們的大模型,面向醫(yī)院、醫(yī)生及醫(yī)管部門(mén),提供AI醫(yī)學(xué)大腦。那么,ChatGPT在醫(yī)療場(chǎng)景有哪些用途呢?ChatGPT的回答是:醫(yī)療問(wèn)答、聊天機(jī)器人、疾病診斷、醫(yī)學(xué)文獻(xiàn)檢索、患者跟蹤等,歸根結(jié)底,它也是在做虛擬醫(yī)生。

云知聲對(duì)ChatGPT做了比較長(zhǎng)時(shí)間的分析,并根據(jù)我們積累的行業(yè)知識(shí)做了一些推導(dǎo),發(fā)現(xiàn)除了上述一些通用的局限之外,ChatGPT在垂直領(lǐng)域還有進(jìn)一步的應(yīng)用局限:

1.在某些問(wèn)題上可以給出一個(gè)很好的答案,但它沒(méi)法對(duì)自己作出的回答援引資料進(jìn)行背書(shū),沒(méi)法對(duì)自己可能出現(xiàn)的錯(cuò)誤負(fù)責(zé),醫(yī)生較難為模型的錯(cuò)誤買(mǎi)單;
2.在醫(yī)療領(lǐng)域的生成文本,難以保證可控,可信和可靠——場(chǎng)景更關(guān)注短板而不是長(zhǎng)板;
3.尚不能整合電子病歷、影像、基因組等多模態(tài)醫(yī)學(xué)數(shù)據(jù);
4.難以導(dǎo)入醫(yī)院內(nèi)部數(shù)據(jù)和知識(shí);
5.難以及時(shí)更新最新文獻(xiàn)結(jié)果;
6.使用成本尤其是監(jiān)管成本的問(wèn)題。

云知聲的主要工作重心就是解決大模型在垂直場(chǎng)景落地的這些具體的局限。例如,我們會(huì)做行業(yè)知識(shí)的增強(qiáng)以解決“幻覺(jué)”的問(wèn)題,會(huì)做企業(yè)檢索的增強(qiáng)、API的增強(qiáng)、微型化以及IO審查,所有這些問(wèn)題都是可解的,都會(huì)在有限的時(shí)間內(nèi)解決。

云知聲李霄寒:模型激增邁向智能涌現(xiàn),企業(yè)將走向通用、垂直兩種路徑丨GTIC 2023

在這個(gè)基礎(chǔ)上,云知聲會(huì)推出面向醫(yī)療行業(yè)的行業(yè)版大模型,并在行業(yè)之上,面向客戶(hù)提供企業(yè)定制版大模型。從2016年進(jìn)入醫(yī)療行業(yè)以來(lái),云知聲經(jīng)過(guò)多年積累,在數(shù)據(jù)層面、在大模型以及知識(shí)圖譜方面都取得了一定的進(jìn)展和成效,有一個(gè)非常好的起點(diǎn)。

云知聲的愿景,就是從醫(yī)療版著手,逐步覆蓋到其他專(zhuān)業(yè)版,最后把各個(gè)專(zhuān)業(yè)版聯(lián)合起來(lái),基于MoE(Mixture of Experts)技術(shù)做模型集成,訓(xùn)練得到通用增強(qiáng)版。

從業(yè)那么多年,這是第一次感覺(jué)AGI距離我們那么近,以前用AI技術(shù)去解決某個(gè)場(chǎng)景的某些問(wèn)題,一旦涉及到業(yè)務(wù)本身如何真正賦能行業(yè)時(shí),就會(huì)遇到各種各樣的應(yīng)用層面問(wèn)題。今天這個(gè)時(shí)間點(diǎn)給了云知聲一個(gè)新的機(jī)會(huì),我們可以真正通過(guò)AI的方式把我們?cè)瓉?lái)的愿景和夢(mèng)想真正落地。謝謝!

以上是李云霄演講內(nèi)容的完整整理。