智東西(公眾號:zhidxcom)
編輯?| ?GTIC

智東西4月18日報道,在剛剛落幕的GTIC 2023中國AIGC創(chuàng)新峰會上,竹間智能創(chuàng)始人兼CEO簡仁賢進行了主題為《如何加速AGI通用人工智能在企業(yè)落地的到來?》的演講。簡仁賢從技術創(chuàng)造實際價值的角度解讀了企業(yè)在落地AGI的過程中所面臨的挑戰(zhàn),以及可行的落地路徑和策略。

簡仁賢說道,基于大型語言模型的產(chǎn)品將成為通用人工智能的操作系統(tǒng),并且將分裂為“兩個世界”,一個是由OpenAI和微軟主導的閉源世界,另一個是由Deepmind和谷歌主導的開源世界。他指出,中國的創(chuàng)業(yè)公司將成為開源模型的最大受益者,因為小型創(chuàng)業(yè)公司具備更強的創(chuàng)新能力,而大公司擁有更充足的資源和資本,所以創(chuàng)業(yè)公司和大公司之間的結合將使得創(chuàng)新更加規(guī)?;⒊尸F(xiàn)“百花齊放”的局面。

未來的軟件范式將是由自然語言技術驅(qū)動應用,形成“大語言模型+知識+應用”的新模式。他認為,模型與用戶之間存在著鴻溝,需要產(chǎn)品來做橋梁,沒有產(chǎn)品的模型無法體現(xiàn)實際價值,因此他主導更具可商用性的“模型即應用”(MaaA)模式。

大語言模型的出現(xiàn)將催生全新的軟件產(chǎn)業(yè),數(shù)以千計基于大模型和生成式AI的應用的公司將涌現(xiàn)出來。未來將是“應用為王”的時代,模型將成為應用的基本組成部分。基于大模型的應用能夠提高白領工作者的生產(chǎn)力與創(chuàng)造力,減少每日工作時間,從而提高幸福感。客戶服務自動化、虛擬助手、知識管理和員工培訓這四個應用場景將首先被顛覆,大模型應用能夠從這四個方面來提高企業(yè)的運營效率,迅速創(chuàng)造價值。

簡仁賢提出了一種方法來平衡大型語言模型和小型語言模型的優(yōu)缺點,他稱之為“自然語言雙引擎”,由小型自然語言處理模型、知識模型和大型模型構成。小型模型可以加強大型模型的可控性、可追溯性和可解釋性,目前,竹間智能主力產(chǎn)品——四大平臺全面以大語言模型和生成生成式AI為核心技術,加上可商用化的模型工廠平臺,為企業(yè)提供較低成本的大模型產(chǎn)品和解決方案。

以下為簡仁賢的演講實錄:???

大家下午好!前面聽了非常多的專家們在大模型、ChatGPT、機器學習、深度學習等技術方面進行分享,下面我不講技術,而是探討一些更實際的問題。

一、研究如何復制OpenAI不重要,讓技術產(chǎn)生價值更重要

ChatGPT已經(jīng)成為新一代AI代名詞,也是未來AGI的代名詞。以十年的跨度來看,我們聊ChatGPT就等于是聊AI的未來。那么,類似ChatGPT的大模型技術如何能夠落地?大家聽了很多ChatGPT的故事,有許多人一直在做反向工程研究,想知道如何復制OpenAI和ChatGPT,想了解背后的原理,可當大家都還在鉆研這些問題的時候,GPT-4出現(xiàn)了,斯坦福大學的Alpaca模型出現(xiàn)了,幾乎每過兩三天就會有AI科技和產(chǎn)品的爆炸性新聞傳來,因此我們已經(jīng)沒有時間去回溯,更重要的是思考未來的技術,如何克服大模型的缺點,把精力和資源放在商用化和模型工程上。怎么利用這個技術,讓它為我們產(chǎn)生價值?不要再去想復制一個OpenAI,應該去考慮怎么樣順應趨勢、如何運用技術去為未來創(chuàng)造更多的價值。

ChatGPT的用戶數(shù)增長創(chuàng)造了記錄,上線兩個月活躍用戶就突破了1億,現(xiàn)在每天都有上億的用戶在使用,而相關的使用數(shù)據(jù)從去年12月份到現(xiàn)在,不斷反饋給OpenAI,讓它一直打磨模型,于是模型能力和Prompt(提示)性能越來越強。

大家知道GPT-4是2022年8月完成訓練的,它所用的數(shù)據(jù)集截止到2021年9月,整體花費了很多精力才推出來,是一項非常大的工程。那我們看一下它到底能夠做什么。在此之前,先給大家介紹一款竹間打造的、使用起來很方便的AIGC產(chǎn)品“靈感閃寫”,我用“閃寫”為今天的演講生成了一篇演講稿,而且前幾天在中東做演講,我也用它生成了英文演講稿。

給大家看一下我是怎么生成的——“閃寫”里面有非常多的模板,我們的目標是打造上千個模板,給不同人群使用。全中國大概有2.5億白領,都需要這些模板。我把今天演講的題目和三個大綱輸入進去,當然它也可以生成大綱,最后這個產(chǎn)品輸出的演講稿和我今天要講的內(nèi)容其實差不多,包括ChatGPT將帶來的紅利、ChatGPT能給企業(yè)帶來的好處、ChatGPT在企業(yè)落地的挑戰(zhàn)、它在企業(yè)落地的實用場景等。

竹間智能簡仁賢:“大語言模型+知識+應用”,自然語言技術推動軟件范式變革丨GTIC 2023

二、ChatGPT聰明,創(chuàng)新源自創(chuàng)業(yè)公司

那么,我們是不是都認同大模型?AGI的起點是不是已經(jīng)到來了?通用人工智能到底是不是我們期望的未來?

我們先來了解一個事實:ChatGPT比人類更聰明。當然,把所有的人類加起來,它比不過,可是如果拿地球上的每一個個體來比較,它就是最聰明的。美國高中生要考AP,而ChatGPT考多科AP的成績可以得滿分5分,AP得滿分相當于大一學生的水平了,另外ChatGPT考LSAT法學院入學測試得分在90%以上,還可以通過美國律師資格考試Bar Exam。如果用高考來測試它,我估計它可以考550分左右。人類里面,沒有哪一個人可以單獨同時應對這些考試并取得高分。

美國超過80%的學生已經(jīng)在用ChatGPT了,我有一個朋友的孩子想到我們公司來實習。他是一名攻讀機器學習方向的名校的研究生,會寫Prompt(提示),會用ChatGPT。并且他們整個機器學習小組都在用ChatGPT,他表示現(xiàn)在已經(jīng)回不到?jīng)]有ChatGPT的日子了??梢姡瑢τ跈C器學習研究來說,ChatGPT的幫助有多大。

很多美國的老師被迫用ChatGPT,因為學生也在用。但是ChatGPT對老師有什么好處?在座的可能有老師,教授,應該知道ChatGPT可以做什么——它可以幫你出題、改作業(yè)、寫評論,增加與學生溝通的效率。美國有老師用ChatGPT來分析自己所在區(qū)域的學生對哪些題目最不熟悉,然后就用這些題目來考他們。一周前有一篇報道,講的是香港科技大學的黃教授宣布用ChatGPT寫作業(yè)可以加分。它在教育界的影響已經(jīng)非常大了。

因此,我認為,ChatGPT這樣的產(chǎn)品會是未來AGI的操作系統(tǒng)。ChatGPT由兩部分組成,它不是一個模型,而是一個產(chǎn)品,它把對話跟大模型結合,使得人類和模型可以交流,讓模型為人所用。

語言模型的技術其實已經(jīng)存在了二三十年了,很多人都可以做模型,為什么達不到ChatGPT這種火爆程度?OpenAI和ChatGPT這樣的組合未來會發(fā)展成什么樣?美國不開放給我們用怎么辦?這個世界會產(chǎn)生多大的變化?我的猜測是,這對全中國的創(chuàng)業(yè)公司會是一大福音。

模型軟件的生態(tài)會有兩個世界,一個是OpenAI+微軟的閉源世界,另一個是DeepMind+谷歌和Meta的開源世界。未來,微軟和OpenAI會像現(xiàn)在一樣繼續(xù)閉源,就像iOS模式。DeepMind和谷歌加上Meta則會繼續(xù)開源。谷歌和Meta都已經(jīng)開源了很強的大模型,這就類似于安卓的模式。

竹間智能簡仁賢:“大語言模型+知識+應用”,自然語言技術推動軟件范式變革丨GTIC 2023

創(chuàng)新是從創(chuàng)業(yè)公司開始的,這句話是真理。OpenAI做出了GPT系列,它本身也是一家創(chuàng)業(yè)公司,一百多人做出來GPT,有了成效之后,微軟投入大量的資源和巨額的資金,才有今天的GPT-4。大公司有錢有資源,但是沒有OpenAI這樣的創(chuàng)新能力。OpenAI的GPT當時也是由他們團隊里的成員研發(fā)出來的,等到需要算力和資金的時候,大公司再進場,這就是典型的創(chuàng)業(yè)公司引領創(chuàng)新的意義。

未來每周、每個月可能都有更多的開源模型問世,也會有更優(yōu)化的訓練技術,讓大模型的訓練成本大大降低,通用數(shù)據(jù)會更方便取得,這樣一來,創(chuàng)業(yè)公司的模型技術能力將得以跟大公司拉平,甚至超越大公司。

在模型領域,國內(nèi)會呈現(xiàn)百花齊放的局面,創(chuàng)業(yè)公司不斷用大模型來打造一些創(chuàng)新的產(chǎn)品,滿足大家的期待。未來的軟件范式是自然語言技術驅(qū)動應用,大模型的通用能力很強,但是也有局限,這些需要持續(xù)去優(yōu)化和克服。

三、大模型+知識+應用才能體現(xiàn)價值

ChatGPT將給企業(yè)帶來巨大的紅利,這些紅利在哪里?怎么產(chǎn)生?先來了解一個事實:用戶和模型之間存在巨大的鴻溝。谷歌與DeepMind在 2017年就發(fā)布了《Attention?is?All?You?Need》,推出了Transformer,但沒有多少人真正用到Transformer,也沒有多少人用到GPT-3,因為沒有產(chǎn)品。而ChatGPT最偉大之處是在模型和用戶之間架設了橋梁,這個橋梁就是產(chǎn)品,讓大多數(shù)的普通人都能夠用得到,這個模型才有價值。

無法產(chǎn)品化和商用化的大模型毫無價值。例如,有人說自己做了一個萬億參數(shù)的模型,并且可以把模型尺寸壓縮到很小,這些毫無價值,有價值的是這個模型能夠變成產(chǎn)品。所以我們倡導的不是MaaS(模型即服務)——你只給出一個API,并沒有價值,能夠開創(chuàng)軟件的新范式才有價值,就像ChatGPT可以通過與人溝通完成任務。

LLM(大語言模型)、Knowledge(知識)、Application(應用)三者加起來才能構建軟件的全新定義。對于新的軟件范式來說,只有模型是不夠的。我預測一年之后模型不那么值錢了,所有大公司、小公司都會先基于開源模型來開發(fā)。未來,應用為王,會出現(xiàn)成千上萬基于大模型的應用,這些狀況現(xiàn)在已經(jīng)露出苗頭了,等到今年年底回頭來看,可能誕生了500個應用,每個應用都在解決一個細分問題。

竹間智能簡仁賢:“大語言模型+知識+應用”,自然語言技術推動軟件范式變革丨GTIC 2023

那么,這對企業(yè)有什么好處?我這邊列出幾個好處,包括減輕行政負擔、提高運營效率、提升客戶體驗、在內(nèi)部優(yōu)化數(shù)字員工、減少溝通障礙、提高溝通效率、提高咨詢和查詢的效率、人機協(xié)同等等。

具體說幾個場景,比如我們寫郵件,有時會讓人誤解部分文字。經(jīng)過AI修改后,就可以讓文章變得更清晰、更通暢,讓大家都明白字里行間的意思,這是生成式AI的最大特點。高質(zhì)量的訓練數(shù)據(jù)投入模型之后,再加上一些知識,能更好地輔助你寫東西。我剛才講的用“閃寫”生成的演講稿,里面融入的知識都是正確的。

再來看提高咨詢和查詢的效率——你必須花費一些時間來詢問及查找答案,但通過ChatGPT馬上就可以得到答案,搜索引擎不再是人們所依賴的獲得知識的方式。搜索引擎從今天開始就要被顛覆掉了,如果大家有機會用到New Bing的Chat功能就明白我的意思,它可以直接給你所需要的答案,而不是一推垃圾廣告或藍色鏈接。當你使用傳統(tǒng)搜索引擎檢索,然后閱讀每個網(wǎng)頁,最后找出來的內(nèi)容可能比ChatGPT給你的內(nèi)容還差,而且你看到的前幾個,甚至第一頁搜索結果都是廣告。

人機協(xié)同則意味著,人能夠跟模型對話,讓它產(chǎn)出你想要的東西,一起完成一個任務,或者一起完成一項工作,這些是透過自然語言來達成的。

在提高企業(yè)運營效率方面,首先,客戶服務自動化會出現(xiàn)替代的現(xiàn)象,換上更強大的智能客服。假如還在靠語料、規(guī)則或人為修改關鍵詞,那肯定全都要被換掉。

其次,虛擬助手可以集成到企業(yè)系統(tǒng)當中,ChatGPT可以擔當HR助理、產(chǎn)品助理、物流助理、班車助理等,這些全部都可以集成進去。竹間的KKbot就是一款基于大語言通用模型的對話系統(tǒng),你用自己的數(shù)據(jù)就可以做出一個ChatGPT的對話機器人。別人向它提問,它會用你給的內(nèi)容來回答。

第三,知識管理可以將企業(yè)的知識釋放出來,竹間的Knowledge Factory通過大模型解析所有的文檔,來構建龐大的知識圖譜。整個過程比以前更快,以前需要六個月的時間,現(xiàn)在可能六小時就可以做到了。企業(yè)用自己的知識圖譜賦能業(yè)務系統(tǒng),就可以形成完整的知識管理體系,這樣企業(yè)的知識就留在自己的大模型中,然后重復訓練,重復應用,企業(yè)的Know-How(技術訣竅)就會越來越強。

第四,員工培訓。ChatGPT是很好的學習工具和訓練工具,那么竹間有一個Emoti Coach智能培訓系統(tǒng),由大語言模型和生成式AI驅(qū)動,AI教練憑借實戰(zhàn)演練來訓練學員,效果比被動式的e-learning強10倍。因此,有了大模型的助力,未來所有的e-learning培訓軟件都將被顛覆掉。

四、ChatGPT落地面臨五大挑戰(zhàn),大小模型混合匹配賦能垂直行業(yè)

ChatGPT落地的挑戰(zhàn)有哪些?

第一,訓練和部署的成本很高,企業(yè)自己搭建并訓練一個大模型不切實際。

第二,需要大量的數(shù)據(jù)進行訓練。參數(shù)量越多,需要的數(shù)據(jù)越多,這才能夠達到高參數(shù)量應有的大模型效果,這個原理大家都知道。當你有一千多億的參數(shù),但數(shù)據(jù)只有一點點,是達不到理想效果的。

第三,需要大量的GPU做訓練,訓練完還要做推理,推理需要的GPU比較少一點,但是這樣龐大的計算量,怎樣才能實現(xiàn)規(guī)模化?很少公司買得起大量的GPU,并且買了GPU后還需要維護。另外,數(shù)據(jù)中心存放在哪里?這些都是問題。

第四,企業(yè)的私有數(shù)據(jù)不能傳到云端。所有的互聯(lián)網(wǎng)公司做出來的大模型都說可以賦能企業(yè),但企業(yè)很多私密數(shù)據(jù)是不能上傳云端的。我們服務的200多家金融業(yè)客戶中,包括銀行、保險、證券、基金,沒有一家允許上傳私有數(shù)據(jù),法規(guī)不允許。安全、保密性和個人隱私是企業(yè)采用大模型和生成式AI必須要重視的。

第五,企業(yè)很難找到厲害的算法科學家和工程師,人才太稀缺了。

對于竹間智能而言,由于ChatGPT的火爆,整個市場突然擴大了起來,因為廣大群眾都已經(jīng)被ChatGPT掀起的浪潮教育了,大家已經(jīng)能體驗到語言模型的超強能力,我們就不需要再去教育用戶了。

同樣,很多企業(yè)的高管和項目組都被ChatGPT、OpenAI教育過,他們知道原來大模型可以做到這樣的程度,以前我們要花很長時間去教育客戶,現(xiàn)在也不用了。自然語言理解的市場需求從現(xiàn)在開始巨量爆發(fā),全球范圍內(nèi)的市場都被激活了。

竹間智能是做自然語言處理起家的,從十幾億參數(shù)的模型到一兩千億參數(shù)的模型都有涉獵。企業(yè)需要的并不是ChatGPT,也不可能在企業(yè)內(nèi)部部署一個ChatGPT,企業(yè)需要合適的大模型,而合適的大模型可能一兩百億參數(shù)就足夠了。

斯坦福大學最新發(fā)布的Alpaca模型,用一張GPU就能完成訓練。我們預測六個月之后,算力需求會越來越小,訓練模型的技術會更創(chuàng)新,壓縮模型的技術會升級,平行計算性能會提高,未來模型訓練的成本會壓縮到現(xiàn)在的1/10,模型會更容易取得,更重要的是如何去應用。

竹間為各行業(yè)提供預訓練模型,其中包含垂直行業(yè)的知識,它們可以派上大用場,而結合大模型之后就更厲害了。行業(yè)領域的大模型,或者說垂直大模型就是將來ChatGPT能提供的巨大紅利。

大模型有個缺點,就是不可追溯,一個大模型有非常多層神經(jīng)網(wǎng)絡。GPT系列是根據(jù)給定文本來預測下一個詞出現(xiàn)的幾率,一個詞一個詞地生成,因此很不可控。如果聊天機器人不可控,對于企業(yè)來說是不可能被接受的,因為萬一這個工具對客戶、對員工胡說八道,企業(yè)要負法律責任。

但我們用小模型來做,上千個小模型就可以管控大模型,讓大模型變得可控、可追溯、可解釋,再加上知識,便形成一個自然語言雙引擎,讓企業(yè)享受大模型生成的優(yōu)點,同時彌補大模型的缺點,還可以用大模型來協(xié)助訓練小模型。這樣交叉匹配做出的產(chǎn)品會更符合企業(yè)的應用需求。

五、五大決策實踐助力AGI落地企業(yè)

AGI在企業(yè)如何落地?是不是要買很多GPU?不一定。

首先,要選能夠最快上線部署的場景,能夠馬上體驗到大模型帶來的好處,不要選比較難的場景。

第二,選不需要跟復雜系統(tǒng)對接的場景,否則企業(yè)感受不到大模型帶來的好處,感受不到NLP帶來的好處。

第三,大模型落地立刻能夠提高員工個人的生產(chǎn)力,減少工作時長,然而通用人工智能未來給人類帶來的最高價值是什么?是降低成本嗎?不對。是提高效率嗎?不對。是提高產(chǎn)能嗎?不對。我常常說,通用人工智能給人類帶來的最大好處是提高人類的幸福感。比如,每個人每天要花兩個小時的時間寫周報、寫學習報告、寫各式各樣的報告,如果每一天可以幫你省下這兩個小時,你是不是多了兩個小時的幸福感?員工有了幸福感,就能積極幫助企業(yè)、個人和家庭創(chuàng)造更高的價值。從這個角度來說,ChatGPT可以提高員工的幸福感,提高老板的幸福感,那么企業(yè)的整體生產(chǎn)力和競爭力自然都會提高。

第四,找現(xiàn)有的業(yè)務場景,避免找新的業(yè)務場景。很多企業(yè)采取新技術都找錯了方向——找創(chuàng)新部門,找創(chuàng)新業(yè)務,再將創(chuàng)新技術放到創(chuàng)新業(yè)務上,這樣做創(chuàng)新做不起來。企業(yè)要在現(xiàn)有的業(yè)務上運用新的技術,才可以快速感知到用了和沒有用之間的差別,才有辦法衡量新技術的價值。

第五,控制場景范圍,由小范圍開始。企業(yè)不應該把一個大項目當做切入點,這是做不起來的,百分之百會失敗。從小范圍,從一個部門或者一個業(yè)務場景開始做,把大模型揉進去,你的業(yè)務比較簡單,需要的模型就沒有那么大,慢慢可以看到效果。

這五點是企業(yè)在接受與應用ChatGPT這類大模型產(chǎn)品時可以去借鑒的。采納這五點,企業(yè)一定可以有所收獲。

我今天的分享就到這里,希望對大家有用。如果各位對于AGI落地企業(yè)有一些意見和想法,或者需要幫助的,歡迎跟我聯(lián)系,我們可以好好探討。未來,無論通用人工智能、ChatGPT這樣的技術如何改變企業(yè),如何改變個人,其最終目的都是提高每一個人的幸福感。

謝謝各位,謝謝大家!

以上是簡仁賢演講內(nèi)容的完整整理。