智東西(公眾號:zhidxcom)
編譯 | 屈望苗
編輯 | 江心白

智東西4月3日消息,據(jù)The Verge報(bào)道,OpenAI最近宣布,其人工智能文本生成器GPT-3現(xiàn)已被數(shù)萬開發(fā)者用于300多個(gè)不同的應(yīng)用程序,每天輸出45億詞之多。

報(bào)道稱,雖然GPT-3生成的大部分文本都很生澀,但如此大的輸出量也反映出,AI文本生成技術(shù)的規(guī)模、影響和商業(yè)潛力正在不斷增長。

一、約2000億個(gè)單詞的訓(xùn)練,讓機(jī)器“開口說話”

GPT-3的全稱叫生成預(yù)訓(xùn)練轉(zhuǎn)換器-3 (Generative Pretrained Transformer-3),這套強(qiáng)大的“大型語言模型”于2020年6月問世,訓(xùn)練了大約2000億個(gè)單詞,估計(jì)花費(fèi)了數(shù)千萬美元。

目前,文本生成是機(jī)器學(xué)習(xí)的一大趨勢。人工智能系統(tǒng)從互聯(lián)網(wǎng)上抓取大量的單詞進(jìn)行學(xué)習(xí),并根據(jù)各種提示生成文本。學(xué)習(xí)完成后,機(jī)器就可以實(shí)現(xiàn)一系列功能,比如創(chuàng)作小說、編寫潦草的代碼,以及讓用戶對話歷史人物等。

二、眾多公司申請使用GPT-3通用API以構(gòu)建服務(wù)

獲取GPT-3底層代碼是OpenAI的一項(xiàng)商業(yè)服務(wù)。GPT-3與微軟簽訂了獨(dú)家協(xié)議,允許微軟獨(dú)家訪問GPT-3程序的底層代碼。

不過,任何公司都可以申請使用GPT-3的通用API,并在此基礎(chǔ)上構(gòu)建服務(wù)。目前已經(jīng)有數(shù)百家公司這樣做了。

美國一家名為Viable的客戶反饋分析公司采用了GPT-3,從調(diào)查、服務(wù)臺票、實(shí)時(shí)聊天記錄和評論中識別出“主題和情緒”;美國的AI虛擬形象公司Fable Studio使用這個(gè)程序?qū)崿F(xiàn)了用戶跟虛擬形象的對話;美國舊金山的人工智能搜索平臺Algolia也在用它改進(jìn)自己的網(wǎng)絡(luò)搜索產(chǎn)品,然后賣給其他客戶。

三、難逃同質(zhì)化、文本質(zhì)量堪憂,應(yīng)用仍存難點(diǎn)

GPT-3的大量使用對OpenAI以及微軟來說都是好消息,因?yàn)槲④汚zure云計(jì)算平臺能夠?yàn)镺penAI提供更強(qiáng)大的技術(shù)支持,但并非所有創(chuàng)業(yè)公司都對此感興趣。

據(jù)分析人士觀點(diǎn),如果不是真正擁有這項(xiàng)技術(shù),那么一家公司全靠GPT-3來構(gòu)建業(yè)務(wù)是十分不明智的選擇。

主要原因在于,盡管使用GPT-3能讓公司和業(yè)務(wù)的創(chuàng)建更加簡單,但自己的競爭對手也同樣能這么做。就算能通過品牌和用戶界面讓公司業(yè)務(wù)打出差異化,技術(shù)背后所產(chǎn)生的大量收益還是歸OpenAI所有。

與此同時(shí),GPT-3的智能文本輸出質(zhì)量也存在令人擔(dān)憂的問題。和許多算法一樣,GPT-3也會吸收和放大有害的偏見,這有時(shí)會讓它犯下“愚蠢的錯(cuò)誤”。例如,在使用GPT-3構(gòu)建的醫(yī)療聊天機(jī)器人進(jìn)行測試時(shí),該模型曾鼓勵(lì)“有自殺傾向”的病人去自殺。

日產(chǎn)45億詞!“地表最強(qiáng)語言模型”GPT-3已落地300多個(gè)應(yīng)用

▲測試中,GPT-3鼓勵(lì)有自殺傾向的用戶言論

去年9月4日,蒙特雷的米德爾伯里國際研究所的兩名研究人員在airXiv平臺上發(fā)布了一篇論文,文章提到,GPT-3在生成激進(jìn)文本方面遠(yuǎn)遠(yuǎn)超過上一個(gè)版本GPT-2。對此,OpenAI也在開發(fā)工具,幫助用戶更好地控制GPT-3生成文本。

結(jié)語:機(jī)器對話來臨,還需摸索前進(jìn)

OpenAI的“45億字”里程碑說明了,像GPT-3這樣的智能文本生成工具目前已經(jīng)在大量生成機(jī)器對話,并且已經(jīng)被開發(fā)者大量地采用。

但當(dāng)前來看,實(shí)際應(yīng)用中算法還是會造成錯(cuò)誤、不公和偏見,過于依賴算法未必是好事。這類問題仍然值得關(guān)注,因?yàn)锳I文本生成的機(jī)器對話還會繼續(xù)下去、甚至愈演愈烈。

或許在未來,我們會迎來一個(gè)充滿機(jī)器人生成對話的世界。

來源:The Verge