智東西(公眾號(hào):zhidxcom)
作者 | 陳駿達(dá)
編輯 | 李水青

智東西6月26日?qǐng)?bào)道,近日,計(jì)算機(jī)視覺(jué)大牛、MIT教授何愷明入職谷歌DeepMind,他在個(gè)人主頁(yè)上更新了自己的最新職位——谷歌DeepMind杰出科學(xué)家(兼職)。同時(shí),何愷明也仍然保留了MIT電氣工程與計(jì)算機(jī)科學(xué)學(xué)院(EECS)的終身教職。

何愷明官宣入職谷歌DeepMind!

何愷明是深度殘差網(wǎng)絡(luò)(ResNet)的提出者之一。他作為第一作者發(fā)表的ResNet論文《Deep Residual Learning for Image Recognition》,是21世紀(jì)被引次數(shù)最多的論文。

文中所提出的殘差連接在現(xiàn)代深度學(xué)習(xí)模型中無(wú)處不在,包括Transformers、AlphaGo Zero、AlphaFold以及當(dāng)今幾乎所有的生成式AI模型。截至今年5月,何愷明的各類(lèi)出版物總被引量已經(jīng)超過(guò)70萬(wàn)次。

何愷明官宣入職谷歌DeepMind!

2024年加入MIT之前,何愷明始終活躍于產(chǎn)業(yè)界與學(xué)術(shù)界,曾陸續(xù)在微軟亞洲研究院(MSRA)、Facebook AI研究院(FAIR)擔(dān)任研究科學(xué)家。他擁有清華大學(xué)物理系基礎(chǔ)科學(xué)班學(xué)士學(xué)位和香港中文大學(xué)信息工程博士學(xué)位,在本科期間,曾在微軟亞洲研究院視覺(jué)計(jì)算組實(shí)習(xí),師從計(jì)算機(jī)視覺(jué)大牛孫劍;在香港中文大學(xué)期間師從香港中文大學(xué)多媒體實(shí)驗(yàn)室創(chuàng)始人、商湯科技創(chuàng)始人湯曉鷗。

除了ResNet之外,何愷明還曾發(fā)表多項(xiàng)極具學(xué)術(shù)價(jià)值、對(duì)AI、計(jì)算機(jī)視覺(jué)產(chǎn)生深遠(yuǎn)影響的研究成果。

2009年,在香港中文大學(xué)期間,何愷明在其第一篇發(fā)表的學(xué)術(shù)論文中提出了“圖像去霧算法”,這篇論文一經(jīng)發(fā)表便斬獲了當(dāng)年度的計(jì)算機(jī)視覺(jué)頂會(huì)CVPR年度最佳論文獎(jiǎng),何愷明也成為CVPR歷史上首位獲此殊榮的華人

2015年,何愷明在微軟亞洲研究院工作時(shí)提出的ResNet在ImageNet圖像識(shí)別大賽中奪冠,相關(guān)論文獲得了2016年的CVPR最佳論文獎(jiǎng)。

在FaceBook AI研究院工作期間,何愷明還在圖像分割領(lǐng)域做出重要貢獻(xiàn),作為第一作者和第二作者分別發(fā)表了Mask R-CNN、Faster R-CNN兩篇重要論文。相關(guān)研究將圖像分割的準(zhǔn)確度和效率提升到新的水準(zhǔn),Mask R-CNN論文獲得了2017年的ICCV最佳論文獎(jiǎng)。

何愷明官宣入職谷歌DeepMind!

何愷明還曾獲得2018年P(guān)AMI青年研究員獎(jiǎng)、ECCV 2018、CVPR 2021最佳論文榮譽(yù)獎(jiǎng)和ICCV 2021埃弗林漢姆獎(jiǎng)等著名獎(jiǎng)項(xiàng)。

目前,谷歌DeepMind和何愷明本人都尚未披露后者入職后具體的安排。不過(guò),我們可以從何愷明近期在CVPR、NeurIPS大會(huì)上的分享中,了解到他眼中具有學(xué)術(shù)價(jià)值的研究方向。

自AlexNet以來(lái),識(shí)別模型已普遍實(shí)現(xiàn)端到端訓(xùn)練和推理,但當(dāng)前主流的生成模型在概念上類(lèi)似于“分層訓(xùn)練”,通常涉及多個(gè)步驟的推理與計(jì)算。何愷明帶領(lǐng)的團(tuán)隊(duì)已于2025年發(fā)表了單步生成模型理論框架MeanFlow。未來(lái),他可能會(huì)持續(xù)探索適用于端到端生成建模的框架。

同時(shí),何愷明還稱(chēng)識(shí)別與生成是一體兩面的問(wèn)題,識(shí)別是從數(shù)據(jù)到嵌入的“流動(dòng)”,而生成是從嵌入到數(shù)據(jù)的“流動(dòng)”。未來(lái),識(shí)別與生成一體化的框架也可能成為其重要研究方向之一。

在2024年于NeurIPS大會(huì)上分享時(shí),何愷明強(qiáng)調(diào):“未來(lái)才是真正的測(cè)試集”。他主張研究者應(yīng)該關(guān)注尚未見(jiàn)過(guò)的新數(shù)據(jù)、新配置、新用例和新情境,以減少研究的“過(guò)擬合”。

在同一場(chǎng)大會(huì)上,何愷明稱(chēng)研究的本質(zhì)在于尋找“驚喜”。在加入谷歌DeepMind后,我們或許可以期待他帶來(lái)更多令人驚喜的科研成果。

來(lái)源:何愷明個(gè)人主頁(yè)