智東西(公眾號:zhidxcom)
作者?|??許麗思
編輯?|? 心緣

智東西11月22日報道,今日,一年一度的2024 IDEA大會在深圳舉行,這場由美國國家工程院外籍院士沈向洋發(fā)起的人工智能盛會,以粵港澳大灣區(qū)為窗口,深入探討了全國及全球視角下的大模型算力趨勢、具身智能、AI+編程、AI for Science、低空經(jīng)濟等熱點議題。

作為IDEA研究院創(chuàng)院理事長,沈向洋進行了近3小時的主題演講,期間發(fā)布多個IDEA研究院創(chuàng)新成果,包括通用視覺大模型、營銷創(chuàng)作大模型、經(jīng)濟大模型、運籌決策大模型、投資大模型、化學(xué)領(lǐng)域?qū)<掖竽P汀⒌涂展芾砼c服務(wù)操作系統(tǒng)等。面向具身智能,IDEA研究院宣布分別與騰訊、美團、比亞迪展開合作。

在人工智能發(fā)展過程中,沈向洋認為,算力、算法和數(shù)據(jù)是最重要的。他直言,過去十幾年,英偉達是人工智能行業(yè)最了不起、最成功的一家公司?!坝ミ_硬生生把自己從自己從做硬件、芯片的乙方變成了甲方,今天能拿得到英偉達的卡就可以說是成功了一半?!?/p>

沈向洋現(xiàn)場透露,明天黃仁勛會到香港科技大學(xué)接受榮譽博士學(xué)位的授予,而他準備現(xiàn)在和黃仁勛討論一些關(guān)于技術(shù)、領(lǐng)導(dǎo)力和創(chuàng)業(yè)的故事,特別是在針對算力發(fā)展的問題,探討未來十年還會不會像過去十年那樣能夠達到100萬倍的增長。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

▲沈向洋現(xiàn)場公布明天將與黃仁勛進行對談

他還強調(diào),具身智能是接下來非常大的機會。如今的多模態(tài)模型實際上沒有真正地理解物理世界,而要走向世界模型,必須要靠機器人。機器人最后會走向千家萬戶、走進每一個家庭,這是一件激動人心的事情。

據(jù)了解,IDEA大會于2021年首度舉行,匯聚產(chǎn)學(xué)研企界領(lǐng)袖,致力構(gòu)建一個凝聚數(shù)字經(jīng)濟多方力量的國際化平臺,是粵港澳大灣區(qū)最具影響力的科技盛會之一。

一、“講卡傷感情,沒卡沒感情”

“我最近一直講的一句話叫作‘講卡傷感情,沒卡沒感情’?!鄙蛳蜓笳f,如果需要進行人工智能的發(fā)展,需要大量高性能顯卡的支撐,可以把它想象成是信用卡,弄100張卡,就需要三四千萬元的投入。

沈向洋談道,近年來,人工智能的蓬勃發(fā)展讓整個行業(yè)充滿期待。在其發(fā)展過程中,算力、算法和數(shù)據(jù)這“三件套”至關(guān)重要。

先看算力。計算行業(yè)在過去四五十年里,算力不斷提升是關(guān)鍵。英特爾提出的摩爾定律表明每18個月算力增長一倍,然而隨著人工智能尤其是深度學(xué)習(xí)的發(fā)展,對算力的需求更高了。

沈向洋覺得,英偉達成為了人工智能領(lǐng)域最了不起、成功的公司。從硬件芯片制造商轉(zhuǎn)變?yōu)樾袠I(yè)主導(dǎo),其出貨量巨大增長,產(chǎn)品供不應(yīng)求。如2023年H100的出貨量龐大,國內(nèi)公司和美國的采購數(shù)量都非??捎^,馬斯克還搭建了10萬張H100卡的集群。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

大模型的發(fā)展是算力需求增長的重要原因。大模型參數(shù)量從百億到千億再到萬億,模型變大對訓(xùn)練要求高,數(shù)據(jù)量也需增長,對算力的需求與參數(shù)呈平方關(guān)系。

從增長倍數(shù)來看,如果一年漲十倍,十年的增長倍數(shù)驚人。從摩爾定律到黃氏定律,黃氏定律是基于模型訓(xùn)練對算力的需求概念。摩爾定律18個月漲一倍,十年是100倍,而一年漲四倍,十年則是100萬倍,這解釋了英偉達市值過去十年漲300倍的現(xiàn)象。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

對于未來十年算力的需求增長,沈向洋稱目前并不確定。不過明天,黃仁勛將到香港科技大學(xué)接受榮譽博士學(xué)位的授予,之后雙方會進行對談,討論技術(shù)、領(lǐng)導(dǎo)力、創(chuàng)業(yè)的故事,也順便請教他一下未來十年的發(fā)展還會不會有100萬倍的增長。

而在算法方面,沈向洋提到自2017年Transformer架構(gòu)出現(xiàn)以來,人工智能、深度學(xué)習(xí)和大模型基本沿著此路線,通過堆數(shù)據(jù)和算力不斷發(fā)展。在GPT-4之后,雖然GPT-5尚未推出,但OpenAI不斷帶來新技術(shù)突破,如多模態(tài)的GPT-4o以及新的推理學(xué)習(xí)能力o1。算法領(lǐng)域不斷有人創(chuàng)造新算法實現(xiàn)突破,方法范式的轉(zhuǎn)移尤其值得思考。

過去幾個月,國內(nèi)一些公司和初創(chuàng)企業(yè)在o1這條道路上取得良好進展。其算法突破思路在于,此前大家關(guān)注的GPT系列主要是預(yù)訓(xùn)練,預(yù)測“下一個token”,通過對數(shù)據(jù)進行聰明壓縮以快速給出答案。而新的范式變革是增強學(xué)習(xí),它更像人的思考過程,有后訓(xùn)練、后推理過程。

增強學(xué)習(xí)并非新事物,很多人都用了,特別是AlphaGo下圍棋就用了此方法。如今其新特點是其打法更通用,不像以前一個系統(tǒng)只能解一個問題。就像o1不僅可以處理數(shù)據(jù)、編程,還能涉及物理、化學(xué)等多個領(lǐng)域。在算法方面,未來幾年沿著SRL這條道路有望出現(xiàn)令人驚艷的發(fā)展。

針對數(shù)據(jù)方面,沈向洋提到,大模型的蓬勃發(fā)展,不僅體現(xiàn)在大參數(shù)上,數(shù)據(jù)量多也是重要方面。

以GPT為例,GPT-3出現(xiàn)時用了2T數(shù)據(jù),GPT-4據(jù)說用了12T,不斷訓(xùn)練后大概用了20T,這是目前互聯(lián)網(wǎng)上能獲取的較干凈的數(shù)據(jù)量,約20萬億。GPT-5遲遲未出,若出現(xiàn),他認為數(shù)據(jù)量大概會到200T規(guī)模。互聯(lián)網(wǎng)上已難找到這么多數(shù)據(jù),所以要合成數(shù)據(jù)來訓(xùn)練未來模型。

沈向洋舉了個例子說明1T數(shù)據(jù)的含義:約等于500萬本書、20萬張高清照片或500萬篇論文。人類歷史上的書籍總量大概21億Token,微博有38億Token,F(xiàn)acebook約140T數(shù)據(jù),但社交媒體上的數(shù)據(jù)質(zhì)量不高。一個人從小學(xué)到大學(xué)真正學(xué)到的知識大概是0.00018T,讀完大學(xué)學(xué)到的東西相當(dāng)于1000本書。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

ChatGPT等人工智能主要用互聯(lián)網(wǎng)數(shù)據(jù),互聯(lián)網(wǎng)發(fā)展40年,公眾在網(wǎng)上發(fā)布了的大量信息,可以說為人工智能的訓(xùn)練做了準備工作。另外,無論訓(xùn)練哪種語言的人工智能,底層高質(zhì)量數(shù)據(jù)多為英文,人工智能時代英文重要性可能增強。

二、發(fā)布通用視覺大模型DINO-X,具身智能合作騰訊美團比亞迪

計算機視覺技術(shù)在真實世界的應(yīng)用場景十分廣泛。然而,過去主流的小模型方案,難以應(yīng)對碎片化、多變的長尾需求,限制了技術(shù)落地規(guī)模。

自2022年起,IDEA團隊從目標檢測出發(fā),打造了精準度、通用性、泛化能力兼優(yōu)的DINO系列視覺大模型。本次大會就發(fā)布了該系列最新的DINO-X通用視覺大模型,擁有真正的物體級別理解能力,實現(xiàn)開放世界(Open-world)目標檢測。無需用戶提示,直接檢測萬物。

與此同時,IDEA團隊還推出行業(yè)平臺架構(gòu),通過一個大模型基座,結(jié)合通用識別技術(shù)結(jié)合,讓模型不需重新訓(xùn)練,就可邊用邊學(xué),支撐多種多樣的B端應(yīng)用需求。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

沈向洋強調(diào),計算機視覺在機器人和具身智能方面也將是發(fā)展的重要方向,機器人最終會走向每一個廠房、每一個家庭。

現(xiàn)場一連宣布了IDEA研究院在具身智能領(lǐng)域布三個合作:與騰訊合作,在深圳福田區(qū)、河套深港科技創(chuàng)新合作區(qū)落地建設(shè)福田實驗室,聚焦人居環(huán)境具身智能技術(shù);與美團合作,探索無人機視覺智能技術(shù);與比亞迪合作,拓展工業(yè)化機器人智能應(yīng)用。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

活動中,IDEA團隊還分享了正在進行的AI助盲應(yīng)用研究。

而針對快速騰飛的低空經(jīng)濟領(lǐng)域,沈向洋總結(jié)了低空經(jīng)濟的發(fā)展四大關(guān)鍵因素:

一是應(yīng)用為王;二是政府為主,需要程序、法規(guī)、政策支持;三是技術(shù)為底;四是安全至上。安全、效率、成本非常重要,只有這些事情做好才能保證支持大規(guī)模的飛行。

大會現(xiàn)場,IDEA推出了低空管理與服務(wù)操作系統(tǒng)OpenSILAS1.0Alpha版,還攜手17家產(chǎn)業(yè)伙伴發(fā)起OpenSILAS創(chuàng)新聯(lián)合體,旨在打造開放共享、技術(shù)領(lǐng)先的系統(tǒng)和平臺,建立有實際系統(tǒng)支撐的標準體系。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

三、合成數(shù)據(jù)能節(jié)省八成以上成本,大模型落地金融運籌投資

大模型能力的涌現(xiàn),離不開互聯(lián)網(wǎng)時代的海量數(shù)據(jù)養(yǎng)料積累。據(jù)沈向洋分享,如今數(shù)據(jù)存量告急,對使用合成數(shù)據(jù)來訓(xùn)練未來模型的需求越來越迫切了。

在這個方向上,IDEA團隊研發(fā)了IDEA Data Maker,通過自研語境圖譜技術(shù),解決過往文本數(shù)據(jù)合成方案的多樣性匱乏等問題,還能為合成數(shù)據(jù)引入“指導(dǎo)手冊”,以圖譜為綱,指導(dǎo)用于合成的語境采樣。

實驗結(jié)果顯示,IDEA團隊的方案能持續(xù)為大模型帶來能力提升,表現(xiàn)超過目前的最佳實踐(SOTA);從token消耗來看,平均節(jié)約成本85.7%。目前,該技術(shù)內(nèi)測平臺已開放,通過API提供服務(wù)。

在拓展新前沿的同時,大模型價值創(chuàng)造也在進行時。大會上,IDEA發(fā)布了多個垂類行業(yè)應(yīng)用落地進展,包括:學(xué)術(shù)大模型和AI科研神器ReadPaper、營銷創(chuàng)作大模型,以及面向經(jīng)濟與金融領(lǐng)域的經(jīng)濟大模型、運籌決策大模型、投資大模型。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

▲經(jīng)濟大模型

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞
▲運籌決策大模型

四、已研發(fā)多款化學(xué)專家大模型,AI編程工具鏈12月份開放

在基礎(chǔ)研究愈發(fā)受到重視的當(dāng)下,AI for Science是技術(shù)創(chuàng)新創(chuàng)業(yè)的重要方向。今年的諾貝爾物理學(xué)獎和化學(xué)獎,更是將這場科學(xué)革命推向聚光燈下。好的AI工具,可以幫助科學(xué)家做出更快、更好的科學(xué)發(fā)現(xiàn)。

IDEA團隊選擇了化學(xué)領(lǐng)域,從預(yù)測能力和數(shù)據(jù)能力入手,進行了研究和產(chǎn)業(yè)化實踐。

在預(yù)測方面,IDEA研發(fā)的多個化學(xué)領(lǐng)域?qū)<掖竽P停肿訉傩灶A(yù)測和化學(xué)反應(yīng)預(yù)測能力均處業(yè)界領(lǐng)先水平;在數(shù)據(jù)方面,IDEA開發(fā)了化學(xué)文獻多模態(tài)大模型,聯(lián)合晶泰科技發(fā)布專利數(shù)據(jù)挖掘平臺PatSight,將藥物領(lǐng)域的專利化合物數(shù)據(jù)挖掘時間,從數(shù)周縮短至1小時。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

除了科學(xué)研究之外,另一個技術(shù)范式正在被AI重塑的領(lǐng)域,是編程語言。

“全世界有那么多的編程語言,小語言、大語言、中語言,基本上沒有一個語言真正被大家所用的是中國人發(fā)明、中國人創(chuàng)造,這種現(xiàn)象我們是有機會可以改變的。”沈向洋說。

此次大會上,IDEA研究院的MoonBit團隊就展示了其AI for coding的最新成果。

MoonBit是專為云計算與邊緣計算設(shè)計的AI云原生編程語言及工具鏈,已具備完備的多后端支持和跨平臺能力,可在硬件上直接運行,支持RISC-V。MoonBit的開源開發(fā)平臺,將于12月正式開放。

據(jù)了解,MoonBit去年底剛開源只有幾百位用戶,今年3月用戶數(shù)量達到三千,不到半年翻了十倍的增長,如今已有將近3萬用戶。預(yù)計2025年底,MoonBit將會有10萬用戶,并爭取2026年底達到百萬級的用戶,成為粵港澳大灣區(qū)現(xiàn)象級的編程語言。

黃仁勛明天登港!沈向洋3小時重磅演講:發(fā)布多款大模型,具身智能激情碰撞

結(jié)語:AI發(fā)展,從推動經(jīng)濟增長到增加人類福祉

過去十幾年來,人工智能的發(fā)展速度令人驚訝,人類許多自豪的能力都逐漸被AI接近甚至是超越。

更令人驚訝的是,如今人工智能的能力已經(jīng)不再是純粹的單點能力的增加,而是通用人工智能整體能力的提升,對社會帶來帶來的影響也變得更為深遠。

沈向洋認為,從長遠的人類社會發(fā)展角度來看,巨大躍遷都是由技術(shù)創(chuàng)新帶來的。工業(yè)時代的全球GDP年均增速約為1%-2%,信息時代在3%-4%,而在人工智能時代,這個數(shù)字會是多少?

在他看來,未來人工智能、機器人的數(shù)量會急劇增加,帶來生產(chǎn)效率的巨大提升,GDP也可能會帶來百分之十幾的增長。

但是,AI的發(fā)展,能不能從推動經(jīng)濟增長到轉(zhuǎn)化為人類的最大福祉?這是在探索AI的道路上,必須要思考的問題。