智東西(公眾號:zhidxcom)
作者|依婷
編輯|漠影

智東西12月5日報道,2022年ChatGPT面世即萬眾矚目,又在兩個月內(nèi)獲得了1億注冊用戶,點(diǎn)燃了大眾對AI的期待,也讓業(yè)界看到了AI大模型技術(shù)廣泛的應(yīng)用前景。

兩年間,AI大模型如雨后春筍般涌現(xiàn)。中國信通院數(shù)據(jù)顯示,截至2024年7月,全球AI大模型數(shù)量為1328個(包含同一企業(yè)、同一模型的不同參數(shù)版本),中國大模型數(shù)量占比36%。行業(yè)對模型的研發(fā)和應(yīng)用也已經(jīng)從最開始的大語言模型,走到了多模態(tài)模型。而算力、網(wǎng)絡(luò)等AI大模型賴以生存和發(fā)展的基礎(chǔ)設(shè)施,仍需要不斷優(yōu)化。

在中國大模型進(jìn)入所謂“洗牌年”的節(jié)點(diǎn)上,昨日,智東西等媒體和中國AI大模型獨(dú)角獸MiniMax副總裁劉華、騰訊云北區(qū)云原生總經(jīng)理田豐進(jìn)行了交流。他們從雙方公司的合作出發(fā),談及了算力、網(wǎng)絡(luò)對AI大模型落地應(yīng)用帶來的影響。

一、多模態(tài)大模型期待更有性價比的算力

MiniMax成立于2021年12月,是“國產(chǎn)大模型六小虎”之一,自主研發(fā)了包括萬億參數(shù)的MoE文本大模型、語音和音樂大模型、圖像大模型、視頻大模型在內(nèi)的多模態(tài)通用大模型。

成立至今三年,基于不同模態(tài)的通用大模型,MiniMax推出了智能助手“海螺AI”、AI內(nèi)容社區(qū)“星野”“Talkie”等C端應(yīng)用;MiniMax開放平臺則為企業(yè)和開發(fā)者提供API服務(wù)。

采訪中,劉華從AI大模型公司的角度出發(fā),談到了多模態(tài)大模型應(yīng)用過程中不斷提高的算力成本問題。

他說,以往的大模型處理的是文本任務(wù),現(xiàn)在的大模型處理的是語音任務(wù)、視頻任務(wù);用token來計算的話,一個小視頻的tokens比一篇文章的tokens高出太多。如果要讓新的技術(shù)落地、讓更多的企業(yè)或個人能夠接受新技術(shù),就必須確保大模型能夠以非常有性價比的方式處理大規(guī)模的輸入或輸出。

二、大集群并不等于大算力,要優(yōu)化資源利用率

自MiniMax成立以來,騰訊云就與其建立了合作關(guān)系,為其提供算力、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施支持。田豐形容兩家公司“是一起手牽手走到今天”,在大模型的發(fā)展過程中,“一起去解決難題,是雙向奔赴的一個過程”。

站在云服務(wù)廠商的視角,田豐分享了這兩三年來自己對客戶需求變化的觀察。

他說,大模型公司客戶早期可能需要的是千卡集群,現(xiàn)在可能都是要上萬卡,后續(xù)可能會到十萬卡,“這個規(guī)模對我們的組網(wǎng)的能力、集群的運(yùn)維,都是一個非常大的、全新的挑戰(zhàn),跟原來完全是不一樣的”。

田豐拿“網(wǎng)絡(luò)”舉例。他稱,訓(xùn)練萬億參數(shù)的大模型時,傳統(tǒng)的網(wǎng)絡(luò)協(xié)議容易造成擁堵、高延時。在這個過程中,0.1%的丟包率都會導(dǎo)致50%的續(xù)訓(xùn)效率的下降;中斷恢復(fù)之后,需要從上一個續(xù)訓(xùn)點(diǎn)繼續(xù)訓(xùn)練模型,這會給萬億規(guī)模的模型訓(xùn)練造成非常大的損失。

另外,田豐還提到,大集群并不等于大算力,算力不是靠簡單地“堆”出來的,而是需要大量優(yōu)化和調(diào)整GPU資源的利用率,以及網(wǎng)絡(luò)傳輸通訊的效率。

結(jié)語:大模型開啟淘汰賽,技術(shù)最終要盈利去賺錢

整整兩年時間,生成式AI走過通用基座大模型的“百模大戰(zhàn)”與“價格戰(zhàn)”,面臨落地應(yīng)用與商業(yè)化檢驗(yàn)。多模態(tài)模型的研發(fā)和優(yōu)化依舊在緊鑼密鼓地進(jìn)行,應(yīng)用落地并成功跑出商業(yè)模式也不可或缺。

AI大模型行業(yè)或許已進(jìn)入淘汰賽階段,算力、技術(shù)、產(chǎn)品都成為競爭要素。中國大模型“洗牌年”,大模型公司和云服務(wù)廠商們都在打起精神。

可能就像是田豐在采訪中說的:“實(shí)踐是檢驗(yàn)AI的唯一標(biāo)準(zhǔn)。AI大模型是長跑,投資人和創(chuàng)業(yè)者都需要有信心和耐心,炫酷的技術(shù)最終還是要落實(shí)到商業(yè)化本身,要盈利去賺錢。”