智東西(公眾號:zhidxcom)
編輯?| ?GTIC

智東西6月5報道,在GTIC 2023中國AIGC創(chuàng)新峰會上,商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆以《AI 2.0 — 大模型帶來的新時代浪潮》為主題發(fā)表演講,解讀了作為“小模型時代”走出的創(chuàng)企的求變之路和能力圈。

AI正引領(lǐng)新一代技術(shù)革命,從AI輔助科研、生成式AI席卷到近期爆火的對話機(jī)器人ChatGPT。大(算)力出奇跡、量變引發(fā)質(zhì)變。楊帆稱,AI生產(chǎn)范式正發(fā)生重大轉(zhuǎn)變——大模型時代到來。

楊帆談道,在過去10年的AI“小模型”時代,解決單一問題的深度學(xué)習(xí)方法與工業(yè)化小模型生產(chǎn)工具逐步成熟;在新的大模型時代,大模型即服務(wù)(MaaS)成為新主題,誕生了圍繞大模型基礎(chǔ)設(shè)施降本、算力數(shù)據(jù)軍備賽、實(shí)時用戶反饋展開的AI新范式。

面向這一趨勢,扎根AI近10年的商湯沉淀出商湯SenseCore大裝置,從AI原生基礎(chǔ)設(shè)施、大模型生產(chǎn)平臺、算法模型服務(wù)、行業(yè)應(yīng)用四個層面,使能極致大模型開發(fā)體驗(yàn)。

楊帆說,商湯將結(jié)合多年行業(yè)經(jīng)驗(yàn)累積,提供高效率、低成本、規(guī)?;男乱淮鶤I基礎(chǔ)設(shè)施產(chǎn)品與服務(wù),全棧加速千億級大模型生產(chǎn)部署,促進(jìn)數(shù)據(jù)采集、標(biāo)注、管理效率大幅提升,縮減模型迭代周期。同時商湯還會通過提供大模型開發(fā)支持服務(wù),保障開發(fā)成果落地。

以下為楊帆的演講實(shí)錄:

感謝今天有這個機(jī)會來跟大家分享一下商湯最近在做的一些工作。今年ChatGPT、大模型非?;?,商湯作為一個從事算法研發(fā)的公司,我們不叫大模型,而是講預(yù)訓(xùn)練模型,這件事情我們從18年就開始在做了。

一、很多預(yù)訓(xùn)練模型的技術(shù)進(jìn)步,比起ChatGPT毫不遜色

在我們看來,今天ChatGPT因?yàn)槟芨鶦端用戶無縫交互的對話式能力,使得最近兩年以大數(shù)據(jù)、暴力美學(xué)為基礎(chǔ)的新的預(yù)訓(xùn)練模型技術(shù)火出圈,被更多人所認(rèn)識和感知到。

過去兩年,我們看到的很多技術(shù)進(jìn)步其實(shí)都是類似的機(jī)理和機(jī)制,我個人認(rèn)為它們的意義某種程度上比起ChatGPT毫不遜色,甚至更大。

比如前年到去年很多AI for Science的突破,今天能夠快速推演所有蛋白質(zhì)的結(jié)構(gòu),能夠做原子劇變的模擬,這些實(shí)際上都是一些最新AI技術(shù)通過更大的模型訓(xùn)練帶來的改變。

商湯科技楊帆:AI將迎來更加繁榮的“大航海時代”,生產(chǎn)范式發(fā)生重大轉(zhuǎn)變丨GTIC 2023

大模型、預(yù)訓(xùn)練其實(shí)是一個非常寬泛的領(lǐng)域,不止是自然語言,也包括視覺、多模態(tài)、決策,雖然決策模型今天的數(shù)據(jù)量級和參數(shù)量級沒有那么大,但是很多模態(tài)模型最終還是要應(yīng)用到?jīng)Q策任務(wù)上。所以在我看來,最近兩年整個AI研究范式確實(shí)產(chǎn)生了非常大的改變,而且這個改變是全方位的。包括AI for Science,不僅僅是技術(shù)的進(jìn)步,過去兩年相關(guān)商業(yè)化節(jié)奏也非常快,很多國內(nèi)外公司已經(jīng)可以利用最新的科研技術(shù),迅速形成一些生產(chǎn)力的轉(zhuǎn)化。

再比如說去年非?;鸬奈纳鷪D,還有最新的Stable Diffusion繪畫結(jié)果,都已經(jīng)是實(shí)實(shí)在在的商業(yè)嘗試。你可以在社交平臺上找到10萬粉絲的AI博主。此前,Midjourney發(fā)布V5版本,已經(jīng)解決了畫手指的問題。

技術(shù)本身在非??焖俚氐粌H僅是對話式大模型。當(dāng)然對話大模型本身有無數(shù)的探討與思考,我們相信它在未來能夠形成大量新的技術(shù)應(yīng)用。今天在國內(nèi)外有很多從業(yè)者已經(jīng)開始用這樣的技術(shù)快速地做一些應(yīng)用的創(chuàng)造與更新。

二、大模型時代,AI生產(chǎn)范式發(fā)生重大轉(zhuǎn)變

這樣技術(shù)的創(chuàng)新與進(jìn)步背后,底層支撐是什么?

今天很多嘉賓提到了大數(shù)據(jù)、大模型以及支撐它的大算力,的確如此。單個AI模型的數(shù)據(jù)參數(shù)量以及所需要的算力規(guī)模到2010、2012年之后是一個非常陡峭的曲線,呈現(xiàn)極高速的增長,它的成本也是非常高昂的。

我們做了一個簡單的測算,微軟現(xiàn)在嘗試把一部分ChatGPT接進(jìn)了Bing搜索結(jié)果,假設(shè)把谷歌每秒的查詢?nèi)緼I化,為了支撐這個東西去跑,意味著300億美金的運(yùn)算成本,非常高昂。

我們面前還有很長的路。一方面是技術(shù)的進(jìn)步,一方面是成本的下降、資源的節(jié)約,還有很多的工作需要我們?nèi)プ觥腉PT-2到GPT-3到3.5再到4,特別是3.5到4,模型參數(shù)并沒有很大變化,主要來自于數(shù)據(jù)量級多了20倍,而產(chǎn)生很大的效果。所有這一切都指向“大力出奇跡,量變引發(fā)質(zhì)變”。在我們看來,這個方向更多意味著整個AI從技術(shù)生產(chǎn)范式以及商業(yè)模式帶來全新的變化。

商湯科技楊帆:AI將迎來更加繁榮的“大航海時代”,生產(chǎn)范式發(fā)生重大轉(zhuǎn)變丨GTIC 2023

商湯2014年成立,經(jīng)歷了上一輪AI的完整商業(yè)化過程。我們看到所有AI技術(shù)創(chuàng)新、算法的迭代,其實(shí)是一個鏈條很長、要不斷高頻迭代形成閉環(huán),最后才能產(chǎn)生應(yīng)用的模式。

這樣的模式有一個問題:鏈條中牽扯到多環(huán)節(jié),而且在每個環(huán)節(jié)需要的技術(shù)能力、業(yè)務(wù)理解、場景能力都是不同的,需要在每個環(huán)節(jié)都保持專業(yè)性。同時,它要求整個迭代頻率比較快,AI所有的技術(shù)今天應(yīng)用在任何一個新場景上,都是不足的,都需要通過快速迭代去改進(jìn)提升。

這某種意義上帶來了高單點(diǎn)成本和高門檻,也是過去我們遇到的AI產(chǎn)業(yè)化沒有達(dá)到多數(shù)人預(yù)期的背后,很重要的原因所在。

超大規(guī)模預(yù)訓(xùn)練模型出現(xiàn)之后,整個生產(chǎn)范式發(fā)生了完全的改變,從AI原生的基礎(chǔ)設(shè)施,包括硬件、計算機(jī)的體系結(jié)構(gòu)、數(shù)據(jù)的組織結(jié)構(gòu)、資源的組織結(jié)構(gòu),甚至包括基礎(chǔ)軟件。

商湯科技楊帆:AI將迎來更加繁榮的“大航海時代”,生產(chǎn)范式發(fā)生重大轉(zhuǎn)變丨GTIC 2023

在這之前,支撐一個可能是更高成本,但是通用泛化能力更好的基礎(chǔ)模型可以進(jìn)行橫向閉環(huán),可以通過更低成本、更低門檻的嵌入去加速整個應(yīng)用邏輯。因?yàn)榻裉熳龊芏郈端應(yīng)用,天然數(shù)據(jù)閉環(huán)更好,形成一個更好的飛輪效應(yīng)。

這中間最重要的,還不是來自于對應(yīng)用場景成本的下降,而是應(yīng)用場景門檻的下降。

三、被改變的不僅是互聯(lián)網(wǎng)應(yīng)用,還有企業(yè)服務(wù)

過去做AI應(yīng)用,很多時候,首先你需要一個懂行業(yè)的人,知道這個技術(shù)工具到底怎么樣解決行業(yè)的問題、去解決行業(yè)的什么問題,以及解決問題之后企業(yè)自身的發(fā)展、商業(yè)模式該怎么設(shè)計,需要你去理解所服務(wù)的行業(yè)、你所服務(wù)的客戶。同時,用好這個工具,你又需要非常專業(yè)的人才、資源、能力,幫助你做算法迭代、技術(shù)的提升。

你可能很幸運(yùn),找到懂行業(yè)的創(chuàng)始人、懂技術(shù)的合伙人,但是接下來你就會發(fā)現(xiàn),兩個人去溝通時,大家有很多底層的常識不一樣,非常難在一個人身上同時具備專業(yè)的人工智能技術(shù)能力和深厚的行業(yè)經(jīng)驗(yàn)和積累。

但是,今天這一切事情不太需要了。我們今天去做一個場景化的應(yīng)用、場景化的服務(wù),對AI的學(xué)習(xí)門檻做大幅下降,不再需要去學(xué)習(xí)那么復(fù)雜的完整的模型訓(xùn)練,不需用讀論文,可能接入第三方的大模型服務(wù),結(jié)合一些領(lǐng)域數(shù)據(jù)和領(lǐng)域Know-how做一些微調(diào)和人工干預(yù),就可以快速實(shí)現(xiàn)場景應(yīng)用的閉環(huán)。

這會帶來整個產(chǎn)業(yè)或技術(shù)革新模式的改變,技術(shù)迭代方式發(fā)生核心轉(zhuǎn)變之后,對于很多人做創(chuàng)業(yè)、做新的應(yīng)用,做企業(yè)服務(wù),在商業(yè)模式上也會帶來大量的改變。

而且因?yàn)檫@個過程中需要更大規(guī)模更低成本的基礎(chǔ)設(shè)施來提供服務(wù),這一定是軍備競賽巨頭級的游戲。同時,在場景應(yīng)用設(shè)計中會更加關(guān)注數(shù)據(jù)閉環(huán)、數(shù)據(jù)飛輪和數(shù)據(jù)積累,它會帶來整個產(chǎn)業(yè)和應(yīng)用非常大的改變。

商湯科技楊帆:AI將迎來更加繁榮的“大航海時代”,生產(chǎn)范式發(fā)生重大轉(zhuǎn)變丨GTIC 2023

很多人說有了這樣一個新的技術(shù)浪潮之后,整個人工智能的所有互聯(lián)網(wǎng)應(yīng)用會被全部重做一遍。

在我們看來,(被改變的)不僅僅是互聯(lián)網(wǎng)應(yīng)用,還有今天的企業(yè)服務(wù)。過去在行業(yè)中,推動產(chǎn)業(yè)數(shù)字化之后下一步的智能化過程中,我們所遇到的一些困難,因?yàn)檫@樣的一些新技術(shù)突破,門檻會被極大降低,會有更多人會參與到整個過程中來,to B也會發(fā)生很大的改變。

這一切依賴的基礎(chǔ),叫作人工智能的基礎(chǔ)設(shè)施。

四、把大算力、大模型、大數(shù)據(jù)構(gòu)建成基礎(chǔ)服務(wù)

什么叫人工智能的基礎(chǔ)設(shè)施?

我們經(jīng)常講智能時代的基礎(chǔ)設(shè)施,大算力、大模型、大數(shù)據(jù),實(shí)際上就是怎么樣把這樣一些核心的基礎(chǔ)性底層能力構(gòu)建出更加規(guī)模化、更加高效率、更加低成本的基礎(chǔ)供應(yīng),這中間包括物理環(huán)境設(shè)施,包括AI原生為AI設(shè)計的基礎(chǔ)底層軟件,包括AI的核心一整套工具體系,以及架設(shè)于之上的模型服務(wù),用它更好地去服務(wù)支持到每個行業(yè)未來的應(yīng)用迭代和發(fā)展。

這是商湯從2019年開始去迭代、去年正式對外發(fā)布的大裝置SenseCore。今天做科學(xué)研究很多時候用到科學(xué)大裝置,它的特點(diǎn)就是投資巨大,規(guī)模也很大,當(dāng)你要突破一些科學(xué)前沿的時候,一定需要大規(guī)模的基礎(chǔ)設(shè)施,才能真正解決問題,這是我們對于人工智能基礎(chǔ)設(shè)施未來發(fā)展方向的理解。我們今天把這樣一種能力作為一個開放的服務(wù),提供給行業(yè)中的伙伴、客戶和兄弟姐妹。

商湯AIDC是2020年上海市第一個人工智能新基建項目,是全亞洲目前為止最大的人工智能專用基礎(chǔ)設(shè)施、專用的人工智能計算中心之一,有將近5000P的算力。通過這樣的一個算力,我們提供完整的AI基礎(chǔ)設(shè)施資源的能力。

除了基礎(chǔ)的資源規(guī)模和量以外,商湯一直以來作為一個以算法應(yīng)用為核心的企業(yè),在過去發(fā)展的十年間積累了大量AI原生的從算法框架到開源模型的能力,我們今天在做的事情是把這樣的能力整合,提供一整套AI原生從資源到硬件到軟件到體系化服務(wù)的能力,通過自動化的工具,幫助更好地訓(xùn)練和使用大模型。

當(dāng)我們講到大模型,很多人在關(guān)注算力。除了算力還有數(shù)據(jù),今天所有人都在講數(shù)據(jù)來源,除了把這些數(shù)據(jù)爬下來,大模型能替代標(biāo)注很多數(shù)據(jù)外,數(shù)據(jù)如何做有效處理、有效管理仍是問題。只做自然語言還好一點(diǎn),你可以用大的文件去存。下一步我們做多模態(tài),首先遇到一個問題——圖像、視頻是海量的小文件,今天有沒有足夠好的文件管理系統(tǒng)去支持百億量級的文件,能夠在一個AI訓(xùn)練任務(wù)上快速地訪問和調(diào)用,這些都是從我們?nèi)タ创粋€AI大規(guī)模訓(xùn)練所面臨的大量原生問題。

我們不僅提供硬件、軟件,還提供一些專業(yè)的專家支持服務(wù),這種服務(wù)涵蓋了今天做一些大模型訓(xùn)練、推理、優(yōu)化。訓(xùn)練一個大模型,這個大模型如果要提供一個應(yīng)用服務(wù),成本會很高昂,模型做好后有沒有辦法做快速蒸餾、快速剪枝,變成一個可以讓下游更低成本使用的商業(yè)化產(chǎn)品。對此商湯提供了一整套的解決方案去服務(wù)今天有志于參與到人工智能2.0新浪潮中的朋友們。今天的嘉賓里有好幾家是我們的客戶,我們現(xiàn)在正在服務(wù)他們,幫助他們?nèi)ビ?xùn)練自己的大模型。

最后有一些例子,很多是視覺和AI for Sicence。我們今天看到基于基模型,基于預(yù)訓(xùn)練的體系,它在不同的細(xì)分領(lǐng)域中已經(jīng)越來越多越來越快地能夠在行業(yè)中產(chǎn)生應(yīng)用,產(chǎn)生實(shí)際價值。

我們相信通過這樣的一些趨勢:未來以人工智能泛化性、通用性為目標(biāo)的大規(guī)模預(yù)訓(xùn)練模型,把它作為一種服務(wù),用它為算力、數(shù)據(jù)、算法在內(nèi)的一體化基礎(chǔ)設(shè)施能力,服務(wù)到更廣闊的不管to B場景應(yīng)用海量市場還是C端互聯(lián)網(wǎng)全部被重做一遍的用戶生態(tài),這一定是未來的核心趨勢。

而在這個過程中,商湯對自己有一個的定位,用一句話來講:“訓(xùn)AI大模型,用商湯大裝置。”歡迎在這方面有興趣的朋友同仁跟我們做交流。

以上是我的分享,謝謝!

以上是楊帆演講內(nèi)容的完整整理。