智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 心緣

智東西4月26日報道,今天下午,AI獨角獸第四范式首次公開了其面向企業(yè)的大模型產(chǎn)品SageGPT(式說大模型),并且首次提出AIGS(AI-Generated Software)戰(zhàn)略,也就是以生成式AI重構(gòu)企業(yè)軟件。

第四范式創(chuàng)始人、首席執(zhí)行官戴文淵現(xiàn)場拔網(wǎng)線測試了式說大模型在圖片理解、多輪對話、圖片代碼、生成代碼、邏輯推理上的能力。

除了這些通用大模型外,戴文淵認(rèn)為,在C端,用戶對于軟件的使用體驗已經(jīng)優(yōu)化的十分到位,但對于B端軟件來說,很多企業(yè)在報銷、申請辦公室等方面的軟件體驗很差,因此B端軟件的體驗有巨大的提升空間。

第四范式提出了AIGS戰(zhàn)略,并將式說定位為基于多模態(tài)大模型的新型開發(fā)平臺。他補充道,要做到AIGS,大模型需要具備Copilot(副駕艙)和思維鏈CoT(chain of thoughts,多步推理)的能力。

第四范式今天公開的已經(jīng)是式說的第三個版本,從今年2月開始,該公司就發(fā)布了具備生成語言能力的式說1.0,后續(xù)又推出加入文本、語音、圖像、表格、視頻等多模態(tài)輸入及輸出能力以及企業(yè)級Copilot能力的式說2.0。

一、寫代碼、文圖互生、“裝箱”難題均不在話下

首先是圖片理解能力,測試人員上傳了一張電視劇《狂飆》的劇照,式說不僅可以描述這張圖片的大致情況,還可以回答圖片中有幾個人、他們在做什么。

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

其次是圖片生成能力,測試人員讓式說“畫一張配色鮮艷的籃球鞋”,它還可以通過背景來突出“籃球”這一元素:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

在代碼生成能力上,測試人員讓式說“請用VBA編寫一個求兩個數(shù)乘積的代碼”:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

在CoT思維鏈能力中,測試人員告訴式說“我想研發(fā)一個萬億參數(shù)的生成式大語言模型,請告訴我解決這個問題的每一步”,它會將涉及到的基本步驟都羅列出來:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

更為基本的聊天能力方面,測試人員讓它做個自我介紹,不過在第一句話上其生成的內(nèi)容出現(xiàn)了重復(fù)性詞語:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

測試人員讓式說做一個旅游規(guī)劃,如“五一假期去硅谷旅游,有什么推薦的地方?”,式說羅列了幾大值得逛的景點:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

寫作能力方面,式說可以“根據(jù)電影《流浪地球2》的情節(jié),寫一個《流浪地球3》的劇本”,它還將前兩部的劇情梗概展現(xiàn)了出來:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

在推理更為復(fù)雜的“裝箱”操作上,式說也快速、準(zhǔn)確的完成了任務(wù),并且測試人員還能查看它的思考過程:

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

二、三個階段,要用生成式AI重構(gòu)企業(yè)軟件

除了具備這些通用能力外,第四范式還提出了AIGC時代的AIGS(AI-Generated Software戰(zhàn)略,也就是以生成式AI重構(gòu)企業(yè)軟件。

戴文淵認(rèn)為,生成式AI可能先改造B端的軟件。他舉了一個關(guān)于二維碼的例子,二維碼支付在國內(nèi)已經(jīng)無處不在,但海外的二維碼支付并不普及,原因在于美國信用卡非常成熟,二維碼相較于信用卡的提升并不大,因此其替代性并不強。但國內(nèi),二維碼支付帶來的體驗升級是從現(xiàn)金支付開始的,因此更為直觀。

同樣,生成式AI改造C端的軟件體驗不見得非常明顯,但對于B端菜單式的軟件,生成式AI可以將其轉(zhuǎn)化成更自然的交互方式。

例如,當(dāng)前的員工想要通過企業(yè)軟件預(yù)定會議室,他們需要找到這個時間段內(nèi)想用的辦公室,然后再去挑選沒有被占用的會議室。而經(jīng)過生成式AI改造后的范式AI助手,員工只需要和它說“查詢會議室:下午14點7樓空閑的會議室”,就能清晰看到當(dāng)前可用的會議室。

因此,AIGS還可以讓復(fù)雜的工作變得更加簡單,第四范式將AIGS的路徑總結(jié)為三個階段:

第一個是Copilot階段,用戶使用自然語言就可以讓Copilot調(diào)動不同的信息、數(shù)據(jù)、應(yīng)用,來完成指令。例如用戶想要把照片的亮度提升20%,不需要用戶拖到修圖軟件中,只需要通過自然語言來輸入進去。

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

第二個階段是Copilot+基于企業(yè)規(guī)則的“知識庫”絕大多數(shù)用戶使用軟件都并不是使用單一功能,而是多個功能的集合,而AI可以參照這一相應(yīng)的規(guī)則來執(zhí)行指令。例如任務(wù)是“把這張照片p的好看一點”,式說就可以查詢“人像美化”知識庫后,依次調(diào)節(jié)圖片的亮度、對比度等。

第三個階段是Copilot+思維鏈,軟件系統(tǒng)的使用行為不斷被大模型學(xué)習(xí),最終形成AI針對這個領(lǐng)域的思維鏈,AI就可以自動按照步驟完成“把照片處理得更好看”等任務(wù)。

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

除此以外,生成式AI對軟件的改造,不僅僅體現(xiàn)在體驗上,還體現(xiàn)在開發(fā)效率上。戴文淵說道,當(dāng)前的軟件開發(fā),絕大多數(shù)都是以月計算時間,更復(fù)雜的軟件開發(fā)可能要以年計算。但生成式AI改造后的軟件開發(fā),可以將這一時間維度縮短到以天計算。

他補充道,AIGC最重要的是將它的能力變成生產(chǎn)力工具,提升企業(yè)的生產(chǎn)效率。因此,第四范式將式說定義為一個軟件開發(fā)平臺,是基于大模型的新型開發(fā)平臺。

式說大模型的優(yōu)勢包括數(shù)據(jù)安全、成本可控的多模態(tài)大模型能力,內(nèi)容可信的知識庫能力,執(zhí)行可控、知錯能改的Copilot能力,以及能夠?qū)崿F(xiàn)多步推理、復(fù)雜任務(wù)拆分、形成數(shù)據(jù)飛輪的思維鏈能力。

第四范式正在快速迭代產(chǎn)品,基于AIGC的能力,幫助企業(yè)內(nèi)部軟件實現(xiàn)效果提升。據(jù)了解,目前,其產(chǎn)品已經(jīng)落地數(shù)十家頭部行業(yè)公司,覆蓋金融、醫(yī)療、能源、航空行業(yè)等。

三、四大能力積累,未來讓機器自己實驗找答案

第四范式在AIGC領(lǐng)域的布局分為四層,分別是底層的式說大模型,能力層的Copilot、知識庫、思維鏈CoT,平臺層的開發(fā)平臺,以及最后在金融、零售、醫(yī)療、制造行業(yè)的應(yīng)用。

第四范式主任科學(xué)家涂威威談道,他們想讓語言模型不只擁有能聊天、會畫畫的能力,而是要成為一個生產(chǎn)力工具。

在1.0階段,大規(guī)模預(yù)訓(xùn)練模型存在知識過時、上下文長度受限的缺陷,第四范式基于Memory Augmentation的核心技術(shù),能輔助大模型進行相應(yīng)推理,解決用戶的實際問題。

此外,這一技術(shù)不僅是將數(shù)據(jù)接進來,還能構(gòu)建一整套的反饋機制,來讓用戶越用越好。

第四范式參戰(zhàn)AI大模型!首提AIGS戰(zhàn)略,現(xiàn)場問答畫畫寫代碼

2.0階段大模型的核心能力是知識庫結(jié)合Copilot,也就是讓機器具有一定的視覺、聽覺和執(zhí)行能力。

通過Plugin模式,大模型可以做一些科學(xué)計算, 讓其應(yīng)用到實際領(lǐng)域中去的時候,能針對每個領(lǐng)域具有專業(yè)的能力。

并且,2.0階段大模型主要是企業(yè)已有的操作規(guī)范,來讓機器模仿人并代替人執(zhí)行相關(guān)流程。

3.0階段就要機器做更多的事情,大模型擁有學(xué)習(xí)更多思維鏈的能力,可以復(fù)制、模仿、學(xué)習(xí)人的行為,甚至于模仿人的一系列動作來執(zhí)行更加復(fù)雜的任務(wù)。

涂威威談道,他們下一個階段的目標(biāo)就是讓機器對著任務(wù)的最終目標(biāo)去學(xué)習(xí),而不是簡單復(fù)制人的步驟,而這往往需要機器去做實驗。

因此,為了降低機器的實驗成本,第四范式未來的方向就是利用大型語言模型,讓機器在虛擬環(huán)境中進行迭代,再應(yīng)用到實際環(huán)境中去,擁有可以解決更高層目標(biāo)的能力。

結(jié)語:B端企業(yè)軟件或成大模型應(yīng)用爆發(fā)點

OpenAI造就的ChatGPT的爆火,驗證了生成式AI產(chǎn)品的可行性,也提升了市場對于大模型的信心,但對于其商業(yè)化路徑的探索,更多還要依靠企業(yè)選擇的方向。

生成式AI的爆火很大程度來源于它對于人們生產(chǎn)效率的顛覆性提升,但對于企業(yè)來說,私域數(shù)據(jù)的安全性與如何快速應(yīng)用前沿技術(shù)同樣重要,就需要更專業(yè)的技術(shù)公司來為提供支持,找到前沿技術(shù)與數(shù)據(jù)安全保護的平衡點。