智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣

智東西9月29日消息,據(jù)“ 互聯(lián)網(wǎng)八卦小喇叭”等媒體爆料,全球頂尖AI科學(xué)家、IEEE Fellow許主洪(Steven Hoi)已加盟阿里通義,轉(zhuǎn)向通義大模型的相關(guān)研發(fā)工作。

許主洪擁有超20年AI產(chǎn)業(yè)和學(xué)術(shù)經(jīng)驗,是新加坡管理大學(xué)終身教授、曾任新加坡南洋理工大學(xué)終身副教授,在AI領(lǐng)域發(fā)表了300多篇頂級學(xué)術(shù)論文,論文被引用超過5萬次,曾被斯坦福大學(xué)評為全球頂尖1%的AI科學(xué)家之一。

作為多模態(tài)大模型領(lǐng)域的領(lǐng)軍人物,許主洪曾擔(dān)任全球最大的企業(yè)軟件公司Salesforce的副總裁,從零開始構(gòu)建了Salesforce在亞洲的AI研究生態(tài)系統(tǒng);他還于2023年創(chuàng)立了一家多模態(tài)AI創(chuàng)企HyperAGI,可以說是業(yè)內(nèi)少有的產(chǎn)學(xué)研多棲AI大牛

曝頂級AI大牛,加入阿里通義!事關(guān)下一代大模型

▲許主洪

2025年2月,許主洪加入阿里并擔(dān)任阿里集團(tuán)副總裁、智能信息事業(yè)群首席科學(xué)家,向智能信息事業(yè)群總裁吳嘉匯報,負(fù)責(zé)AI To C業(yè)務(wù)的多模態(tài)基礎(chǔ)模型及智能體(Agents)研究與應(yīng)用

按原本的定位,許主洪的核心任務(wù)大概是組建頂級AI算法團(tuán)隊,整合通義(應(yīng)用)、夸克、天貓精靈等內(nèi)部資源,促進(jìn)多模態(tài)交互產(chǎn)品迭代,加速AI To C商業(yè)化。

在今年6月的2025上海世界移動通信大會上,許主洪發(fā)表題為《多模態(tài)大模型發(fā)展與演進(jìn)》的演講,在演講中他以夸克App的AI超級框、AI相機(jī)等功能為例講解了多模態(tài)大模型的應(yīng)用場景。

曝頂級AI大牛,加入阿里通義!事關(guān)下一代大模型

▲許主洪以夸克為例講解多模態(tài)大模型應(yīng)用場景

然而,在加入阿里7個多月后,許主洪傳出加入通義實驗室團(tuán)隊,這意味著他可能將從面向AI To C商業(yè)化研發(fā)轉(zhuǎn)向更基礎(chǔ)前沿的大模型研發(fā)。

如果消息屬實,這意味著阿里完成了一次重大的人才重配,也標(biāo)志阿里在多模態(tài)大模型研發(fā)領(lǐng)域再投重碼。

當(dāng)下,阿里通義大模型正處于“拼迭代速度”、“多模態(tài)發(fā)展”的關(guān)鍵階段,十分需要許主洪這樣對口的頂尖產(chǎn)學(xué)研多棲且有分量的AI大牛坐鎮(zhèn)。

在9月底舉辦的2025云棲大會期間,阿里云智能集團(tuán)首席技術(shù)官、通義實驗室負(fù)責(zé)人周靖人透露,連續(xù)發(fā)布數(shù)十款模型背后有戰(zhàn)略考量:全球AI模型進(jìn)展都在加速,整個通義家族一直在跟全球AI領(lǐng)域的領(lǐng)先者進(jìn)行你追我趕,AI今天已進(jìn)入加速期,比拼的是模型迭代效;同時模型從單模態(tài)到多模態(tài)的演進(jìn)是必然趨勢,阿里期待接下來在多模態(tài)方面還有進(jìn)一步的創(chuàng)新和突破。

許主洪或是目前阿里最適合牽頭做這件事情的人。他曾在在今年5月螞蟻技術(shù)開放日上的演講中提到,當(dāng)下,用統(tǒng)一的框架做理解和生成,發(fā)展多模態(tài)大模型的一大演進(jìn)趨勢。但這一領(lǐng)域發(fā)展尚處于的初級階段,需要實踐驗證。

曝頂級AI大牛,加入阿里通義!事關(guān)下一代大模型

▲許主洪在講解統(tǒng)一多模態(tài)模型產(chǎn)業(yè)發(fā)展脈絡(luò)

許主洪指出,統(tǒng)一理解與生成的多模態(tài)大模型面臨眾多技術(shù)挑戰(zhàn)在全模態(tài)交互挑戰(zhàn)方面,當(dāng)下支持音、視、圖、文全模態(tài)交互的公開單模型非常少見;在理解與生成統(tǒng)一方面,圖像和語意的理解生成統(tǒng)一模型鮮有出現(xiàn),且理解和生成效果難以平衡。

而在6月的演講中,許主洪也提到:“多模態(tài)Agent AI時代才剛剛開始,未來要真正達(dá)到AGI,我們還需要解決很多技術(shù)難題,包括多模態(tài)大模型的基礎(chǔ)能力、Agent智能體的核心功能模塊、數(shù)據(jù)世界的連接與操作、物理世界的交互與控制等等,都有很多的挑戰(zhàn),但是這也是未來多模態(tài)大模型行業(yè)的機(jī)會?!?/p>

截至目前,阿里及許主洪方未對此進(jìn)行置評。