智東西(公眾號(hào):zhidxcom)
作者 | ZeR0
編輯 | 漠影
智東西9月7日?qǐng)?bào)道,2023Inclusion·外灘大會(huì)今日開幕,在下午的“AI前沿技術(shù)發(fā)展與應(yīng)用的新浪潮”論壇期間,來自高校、科研單位、科技企業(yè)及投資機(jī)構(gòu)的學(xué)者專家們齊聚,分別從算法、算力、產(chǎn)業(yè)、應(yīng)用、場(chǎng)景等不同視角,探討生成式AI和大模型產(chǎn)業(yè)現(xiàn)存的挑戰(zhàn)與發(fā)展趨勢(shì)。
會(huì)后,螞蟻集團(tuán)副總裁徐鵬與小冰公司CEO李笛接受智東西等媒體的采訪,就大模型及AIGC應(yīng)用同質(zhì)化問題、開源與閉源路線的選擇、數(shù)據(jù)及算力稀缺情況等焦點(diǎn)議題進(jìn)行深入交流。
徐鵬在致辭中談道,當(dāng)前,AI大模型技術(shù)正高速迭代,新模型、新算法、新應(yīng)用、新場(chǎng)景正不斷涌現(xiàn),挑戰(zhàn)也隨之而來,比如算力能耗問題、中文公開數(shù)據(jù)集語料不足問題、大模型應(yīng)用安全問題,解決這些問題,需要產(chǎn)學(xué)研各界力量協(xié)同創(chuàng)新。技術(shù)的公平普惠性也要關(guān)注,無論是大型還是中小企業(yè),都能借助AI大模型技術(shù)提升企業(yè)智能化水平,為用戶帶來更好的服務(wù)和體驗(yàn)。
一、大模型雷同問題嚴(yán)重,應(yīng)用創(chuàng)新才能實(shí)現(xiàn)大發(fā)展
關(guān)于大模型同質(zhì)化問題,李笛和徐鵬都認(rèn)為,從應(yīng)用入手,可以做出非常多不一樣的東西。
在論壇圓桌環(huán)節(jié),李笛談道,自己最大的憂慮是國(guó)內(nèi)大模型的多樣性,大家用同樣的數(shù)據(jù)集、同樣的訓(xùn)練方法、同樣的master,對(duì)比同樣的對(duì)象、類似的方法,多樣性確實(shí)有很大問題?!艾F(xiàn)在處于技術(shù)百花齊放的狀態(tài),應(yīng)該嘗試不同的東西,而不是馬上數(shù)理化外語卷起來了?!?/p>
“我覺得現(xiàn)在行業(yè)里面最大的問題其實(shí)就是「太雷同了」,大家都沿著同一條路徑在往前走,沒有多樣性,這和創(chuàng)新精神是違背的。”李笛認(rèn)為,創(chuàng)新不是追趕,而是有自己新的方法,去實(shí)現(xiàn)自己的優(yōu)勢(shì)。他告訴智東西,大模型首先得追及格,再去嘗試多樣化、差異化,重復(fù)造輪子沒有必要,在應(yīng)用上才能實(shí)現(xiàn)大的發(fā)展。
徐鵬非常認(rèn)可李笛的觀點(diǎn),大家都是在追趕,首先要及格,及格后才有機(jī)會(huì)發(fā)展的更好,大模型技術(shù)上沒有本質(zhì)的差異,但側(cè)重點(diǎn)不一樣,像Llama是做一個(gè)通用的開源基礎(chǔ)模型,GPT本身是閉源的,主要是做ChatGPT對(duì)話能力,達(dá)到通用人工智能(AGI),在對(duì)齊方面要做的很好、上下文長(zhǎng)度做的很長(zhǎng),每個(gè)既有雷同的地方,又有自己的特色。
他相信像這樣非?;A(chǔ)的底層技術(shù),開源是未來。中國(guó)形成自己的大模型開源生態(tài),還需給一定的時(shí)間。開源模型給應(yīng)用創(chuàng)新帶來便利,不用從頭開始浪費(fèi)大量的財(cái)力去訓(xùn)練基礎(chǔ)模型,如果大家都將力量放在應(yīng)用創(chuàng)新上,應(yīng)用生態(tài)更加繁榮,會(huì)反過來推動(dòng)大模型技術(shù)的發(fā)展。
據(jù)他觀察,美國(guó)很多公司放棄走基礎(chǔ)模型這條路,直接在上面做能夠創(chuàng)造附加價(jià)值的應(yīng)用,而應(yīng)用多樣性才能給人類、給社會(huì)帶來價(jià)值。
徐鵬感覺,這一波大模型的能力,還不能做出來真正讓人人都能夠獲益的agent,但可能是可以真正往前推進(jìn)的方向。至于爆款A(yù)IGC應(yīng)用,在他看來,這是可遇不可求的東西,即便如ChatGPT,也會(huì)有一定的審美疲勞,能夠持續(xù)增長(zhǎng)的應(yīng)用非常少。
在李笛看來,開源模型生態(tài)過去已經(jīng)證明了非常旺盛的生命力,但大模型開源目前為止把整個(gè)戰(zhàn)場(chǎng)變得更加混亂。至于未來到底是閉源還是開源,取決于在行業(yè)中的角色定位,如果做大模型,肯定是閉源,如果是一家云計(jì)算公司,要兼容各種模型,開源和閉源都是好的生態(tài)。
二、建高質(zhì)量中文數(shù)據(jù)集是苦力活,英偉達(dá)GPU并非無可取代
大模型不能解決所有的事情,需要組合更多技術(shù)、靠整個(gè)系統(tǒng)不停幫它彌補(bǔ)。李笛聯(lián)想到他最欽佩的一家公司任天堂,跟微軟和索尼相比,任天堂不是堆最先進(jìn)的硬件,而是榨干1080P成熟技術(shù)的最后一點(diǎn)能力,這很重要。
他認(rèn)為,數(shù)據(jù)并不是問題,中文語料如果做了好好清洗,還是可以的。把語料真正挖清楚,清洗得足夠好,篩選得足夠好,這是苦力活。徐鵬補(bǔ)充說,這個(gè)苦力活,誰都逃不開,但是中文本身數(shù)據(jù)的量級(jí)應(yīng)該是夠的。
除了需要更多高質(zhì)量數(shù)據(jù),算力也永遠(yuǎn)緊缺。
李笛說,算力消耗合不合理,取決于商業(yè)模式效果,比如游戲NPC,拿很多算力陪人聊天,游戲掙得錢都被NPC聊沒了,算力再多也不合理;如果消耗的算力被用于通過生成式AI得到高附加值的收益,算力消耗則是合理的。
根據(jù)徐鵬今日的演講內(nèi)容,螞蟻基礎(chǔ)語言大模型采用Transformer架構(gòu),使用英偉達(dá)GPU、螞蟻?zhàn)匝械哪P图軜?gòu)、高效訓(xùn)練和推理引擎。
作為AI訓(xùn)練芯片的首選,英偉達(dá)GPU是當(dāng)前生成式AI算力紅利的大贏家。但徐鵬并不認(rèn)為英偉達(dá)GPU具有非常強(qiáng)的不可替代性,他告訴智東西,這更多是個(gè)效率問題,因?yàn)橛ミ_(dá)發(fā)展的最快、有很強(qiáng)的軟件優(yōu)勢(shì)、用它的產(chǎn)品效率最高,開箱可用。
應(yīng)用方采購硬件,有兩個(gè)因素影響決策買哪些硬件、買多少因素:一是性價(jià)比高不高,二是能不能買到。其他公司并不是說沒有機(jī)會(huì),只是現(xiàn)在還不及英偉達(dá)那么成熟,除了硬件本身能力外,還需努力追趕英偉達(dá)的軟件銜接能力。
李笛相信,恰恰因?yàn)榇竽P吞F了,大家很快會(huì)走到一條好的道路上,因?yàn)椴豢赡軣X燒很久,他相信很快就會(huì)有變化。
三、從技術(shù)信仰轉(zhuǎn)向產(chǎn)品驗(yàn)證,AIGC亟待探索全新商業(yè)模式
“很高興看到整個(gè)行業(yè)開始進(jìn)入到了從技術(shù)的信仰到產(chǎn)品的驗(yàn)證狀態(tài),在未來一年里面的時(shí)間,大部分的產(chǎn)品應(yīng)用會(huì)進(jìn)入到證偽階段?!崩畹言诎l(fā)表演講時(shí)談道,生成式AI創(chuàng)造的價(jià)值與技術(shù)所對(duì)應(yīng)的公司實(shí)際獲得的價(jià)值之間存在巨大的鴻溝,這是他看到的當(dāng)前商業(yè)模式最大問題,無論是To C還是To B都應(yīng)考慮這一問題。
在他看來,目前為止在全球范圍內(nèi),沒有一個(gè)成功的AI To C的產(chǎn)品,也沒有To B的產(chǎn)品。
過去API調(diào)用的商業(yè)模式,很大的問題是直接把技術(shù)的特點(diǎn)輸出了,相當(dāng)于把科學(xué)家手頭工作直接懟到客戶面前,中間缺少產(chǎn)品化的階段,也就沒有體現(xiàn)出生成式AI的創(chuàng)造力價(jià)值。
很多人已經(jīng)開始探索新的AIGC商業(yè)模式。小冰積極嘗試Revenue Share的方式,以高附加值作為價(jià)值回報(bào)的考量依據(jù),李笛認(rèn)為,大模型創(chuàng)造了一個(gè)高附加值的一次交互或一次調(diào)用,比期待算力成本下降更加有效,用最貴的GPU、最好的技術(shù)都是合理的。
以小冰通過合作幫助動(dòng)漫工作室打造的生成作品為例,如果按照傳統(tǒng)商業(yè)模式,游戲廠商總計(jì)一次性技術(shù)開發(fā)收費(fèi)為幾十萬人民幣,而通過Revenue Share的新方式,3分鐘《人和狗》短片上架,小冰獲得了15萬美元的回報(bào)。此外,小冰和網(wǎng)易合作推出了一個(gè)新的平臺(tái),每一個(gè)AI歌手都享有全部生命周期里全部收益的比例,這樣的方法才有可能使得真正獲得創(chuàng)造力價(jià)值。
結(jié)語:中國(guó)已經(jīng)有好的高原,接下來一定會(huì)產(chǎn)生自己的高峰
李笛強(qiáng)調(diào)說,技術(shù)發(fā)展不是一飛沖天的,都是進(jìn)入波峰,很多人有創(chuàng)新,又卡住了,突然不知是誰解決了行業(yè)難題,大家一起又繼續(xù)前進(jìn)。
面對(duì)持久的大模型熱潮,徐鵬建議要冷靜看到它長(zhǎng)期能帶來什么樣的價(jià)值、它的能力邊界在什么地方,而不是盲目地做太多不切實(shí)際的幻想。但又不能離開幻想,因?yàn)橛谢孟氩庞袆?dòng)力,才有更多的人愿意去做一些看上去不靠譜的事情。
他希望有一定機(jī)制去支持有人長(zhǎng)期在這個(gè)方向做進(jìn)一步地投入,然后找到核心應(yīng)用場(chǎng)景,找到它真正能夠帶來變化的東西,有了這些,就可以反哺AI技術(shù)的發(fā)展。
這與清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)的觀點(diǎn)不謀而合。劉知遠(yuǎn)在今日的圓桌論壇期間談道,為什么ChatGPT被美國(guó)做出來了,中國(guó)做不出來?結(jié)論是“中國(guó)有高原、沒高峰”,最原始創(chuàng)新的工作目前仍缺少相應(yīng)穩(wěn)定支持的機(jī)制,但無論怎樣,一切還是在向好的方向發(fā)展。
現(xiàn)在百模大戰(zhàn)有一些內(nèi)卷的傾向,但他相信隨著內(nèi)卷不斷進(jìn)行,會(huì)變成大家開始尋找差異化的過程,“我們有了這么一個(gè)非常好的高原,接下來一定會(huì)產(chǎn)生自己的高峰?!眲⒅h(yuǎn)說。