智東西(公眾號(hào):zhidxcom)
編譯|萬(wàn)貴霞
編輯|云鵬

智東西1月14日消息,據(jù)美國(guó)科技媒體The Information報(bào)道,兩位科技大廠前AI研究員——谷歌DeepMind前成員戴明博(Andrew Dai)與蘋果前研究科學(xué)家楊寅飛(Yinfei Yang),聯(lián)合創(chuàng)立了Elorian公司。該公司專注于開發(fā)能夠同時(shí)理解和處理文本、圖像、視頻及音頻的AI模型。

目前,Elorian正在推進(jìn)一輪規(guī)模達(dá)5000萬(wàn)美元(約合人民幣3.5億元)的種子輪融資,Striker Venture Partners有望成為本輪領(lǐng)投方,雙方洽談已進(jìn)入關(guān)鍵階段。

戴明博出身于高知家庭,他父親是機(jī)構(gòu)學(xué)和機(jī)器人學(xué)領(lǐng)域大佬戴建生。作為Elorian的CEO,他之前在谷歌DeepMind任職超14年,負(fù)責(zé)數(shù)據(jù)驅(qū)動(dòng)型預(yù)訓(xùn)練相關(guān)工作。他深耕深度學(xué)習(xí)領(lǐng)域20年,曾在劍橋大學(xué)、愛丁堡大學(xué)攻讀過學(xué)位,是機(jī)器學(xué)習(xí)方向的博士。

Elorian另一位聯(lián)合創(chuàng)始人楊寅飛,學(xué)生時(shí)期曾在南京郵電大學(xué)Echo實(shí)驗(yàn)室,參與差分進(jìn)化算法參數(shù)控制相關(guān)研究,畢業(yè)作品Apollo3D(阿波羅3D)獲蘇州機(jī)器人世界杯第五名。他還參與癲癇診斷研究,開發(fā)MRI圖像配準(zhǔn)與可視化系統(tǒng),之后在美國(guó)賓夕法尼亞大學(xué)攻讀碩士學(xué)位。

在AI創(chuàng)業(yè)從“拼應(yīng)用”轉(zhuǎn)向“拼底層能力”的背景下,具備長(zhǎng)期基礎(chǔ)模型研究經(jīng)驗(yàn)的華人科學(xué)家正加速走向創(chuàng)業(yè)前臺(tái),Elorian成為近期視覺AI賽道中備受關(guān)注的案例之一。

一、前谷歌DeepMind與蘋果研究員聯(lián)合創(chuàng)業(yè)

據(jù)The Information報(bào)道,Elorian公司由戴明博與楊寅飛聯(lián)合創(chuàng)立。

戴明博與楊寅飛的領(lǐng)英個(gè)人資料顯示,二人目前就職于一家“隱形(Stealth)”狀態(tài)的公司,戴明博是該公司的CEO。

業(yè)內(nèi)普遍認(rèn)為,這家“隱形”公司很可能是Elorian。

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲“隱形(Stealth)”的領(lǐng)英主頁(yè)資料(圖源:領(lǐng)英)

1、戴明博,深耕DeepMind 14年,擔(dān)任Gemini預(yù)訓(xùn)練工作

據(jù)戴明博領(lǐng)英個(gè)人資料顯示,他在谷歌DeepMind工作超過14年,是Gemini數(shù)據(jù)領(lǐng)域的聯(lián)合負(fù)責(zé)人,擔(dān)任Gemini預(yù)訓(xùn)練工作。

此前,戴明博曾參與谷歌SGE的建模工作,在谷歌大腦Google Brain)從事自然語(yǔ)言處理研究,在谷歌健康(Google Health)從事電子健康記錄研究,并參與了Google Now的開發(fā)。

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲戴明博(圖源:領(lǐng)英)

在領(lǐng)英自我介紹中,戴明博寫到自己在深度學(xué)習(xí)領(lǐng)域擁有豐富經(jīng)驗(yàn),研究方向包括自然語(yǔ)言理解和大型語(yǔ)言模型。

戴明博2003-2006年在英國(guó)劍橋大學(xué)計(jì)算機(jī)科學(xué)專業(yè)學(xué)習(xí);2007-2012年在愛丁堡大學(xué)攻讀機(jī)器學(xué)習(xí)博士。

他過去20年來一直從事預(yù)訓(xùn)練相關(guān)研究。其研究主要集中在開發(fā)評(píng)估AI模型訓(xùn)練數(shù)據(jù)質(zhì)量的技術(shù),并確保模型使用來自各種不同來源的數(shù)據(jù)進(jìn)行訓(xùn)練。

據(jù)相關(guān)報(bào)道消息,戴明博出生于高知家庭,他的曾祖父畢業(yè)于金陵大學(xué)(南京大學(xué)前身),爺爺畢業(yè)于廈門大學(xué)土木工程系。

戴明博的爸爸則是開辟了國(guó)際機(jī)構(gòu)學(xué)機(jī)器人學(xué)研究新領(lǐng)域的大佬、現(xiàn)南方科技大學(xué)機(jī)器人研究院院長(zhǎng)戴建生。

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲戴明博在福建莆田的家庭合照,右下1為戴建生,左上1為戴明博(圖源:公眾號(hào)angrysprite不可言喻)

可能受父親的耳濡目染,戴明博也攻讀機(jī)器學(xué)習(xí)相關(guān)專業(yè),從事谷歌DeepMind相關(guān)工作,且創(chuàng)立了Elorian公司。

2、楊寅飛,橫跨谷歌蘋果,主攻視覺和語(yǔ)言多模態(tài)模型領(lǐng)域

楊寅飛領(lǐng)英主頁(yè)資料顯示,他于2022年1月加入蘋果,擔(dān)任蘋果公司AI機(jī)器學(xué)習(xí)部門的研究科學(xué)家。

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲楊寅飛(圖源:谷歌楊寅飛主頁(yè))

楊寅飛在學(xué)生階段就開始接觸行業(yè)相關(guān)工作。據(jù)楊寅飛的谷歌個(gè)人介紹,2007年12月至2009年7月,他曾作為研究助理南京郵電大學(xué)Echo實(shí)驗(yàn)室進(jìn)化計(jì)算研究組工作,參與設(shè)計(jì)了一種用于控制差分進(jìn)化算法參數(shù)的新方法。

在本科階段,楊寅飛完成的畢業(yè)作品名為Apollo3D(阿波羅3D),主要用于Robocup足球模擬器中的 Simu-Robot動(dòng)作設(shè)計(jì)。該作品曾在蘇州機(jī)器人世界杯比賽中獲得第五名

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲楊寅飛的畢業(yè)作品Apollo3D圖像演示(圖源:Source Forge)

2010年5月至10月,楊寅飛參與了一項(xiàng)跨校、跨國(guó)合作研究,與南京航空航天大學(xué)的鄭剛及田納西理工大學(xué)的 Forrest Sheng Bao合作,圍繞AI與腦磁圖(MEG)結(jié)合的癲癇診斷軟件展開研究,目標(biāo)是驗(yàn)證機(jī)器學(xué)習(xí)方法在癲癇診斷中的可行性。

在具體實(shí)現(xiàn)上,他參與開發(fā)了一套用于MRI圖像配準(zhǔn)與可視化的軟件系統(tǒng),并結(jié)合基于SAM-kurtosis algorithm(SAM[g2])計(jì)算的結(jié)果,對(duì)來自CTF腦磁圖系統(tǒng)的數(shù)據(jù)進(jìn)行處理。該項(xiàng)目源碼已開源,并發(fā)布在Source Forge平臺(tái)。

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲MRI圖像可視化系統(tǒng)CTF-SAM-OUT的圖像演示(圖源:Source Forge)

2011年5月至2012年5月,楊寅飛擔(dān)任Longin Jan Latecki教授的研究助理,該教授是美國(guó)天普大學(xué)(Temple University)計(jì)算機(jī)與信息科學(xué)系的博士生導(dǎo)師。

谷歌蘋果華人大佬創(chuàng)業(yè),融資3.5億,或憋多模態(tài)模型大招

▲2012年,Longin Jan Latecki教授發(fā)表論文《基于足跡檢測(cè)的跟蹤方法,實(shí)現(xiàn)對(duì)非靜態(tài)目標(biāo)物體的導(dǎo)航》,楊寅飛擔(dān)任二作(圖源:天普大學(xué)主頁(yè))

2012年至2013年,楊寅飛在美國(guó)賓夕法尼亞大學(xué)攻讀碩士學(xué)位,研究方向包括計(jì)算機(jī)視覺、機(jī)器人學(xué)和自然語(yǔ)言處理。

2013-2017年期間,他先后在亞馬遜Redfin擔(dān)任研究工程師,負(fù)責(zé)機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺領(lǐng)域的研究。

之后,他在谷歌任職超4年,從事自然語(yǔ)言處理的研究,包括語(yǔ)義檢索(semantic retrieval)、多語(yǔ)言表示(multilingual representation)和多模態(tài)表示(multimodal representation)等。

2022年,楊寅飛擔(dān)任蘋果公司AI機(jī)器學(xué)習(xí)部門的研究科學(xué)家,主要研究視覺和語(yǔ)言基礎(chǔ)模型。

他于去年12月離開蘋果,與戴明博一起籌劃創(chuàng)立Elorian。

二、Elorian能同時(shí)理解圖像、視頻和音頻,計(jì)劃融資3.5億元

戴明博在The Information的電話采訪中說,Elorian專注于構(gòu)建能夠通過同時(shí)處理圖像、視頻和音頻來對(duì)物理世界進(jìn)行視覺解讀和分析的AI模型。

戴明博還說,雖然機(jī)器人技術(shù)是Elorian的一個(gè)潛在應(yīng)用領(lǐng)域,但這家初創(chuàng)公司設(shè)想了許多其他應(yīng)用,不過他并未詳細(xì)說明。楊寅飛尚未對(duì)此置評(píng)。

視覺推理模型因具備多模態(tài)功能整合能力,專為機(jī)器人系統(tǒng)等復(fù)雜AI應(yīng)用場(chǎng)景設(shè)計(jì),從而節(jié)省開發(fā)人員拼接不同AI模型的工作量。

一些研究人員向外媒解釋道,這項(xiàng)技術(shù)對(duì)于需要解讀和理解圖像以執(zhí)行高級(jí)任務(wù)的AI智能體來說非常有價(jià)值。

在融資方面,外媒據(jù)戴明博和另一位知情人士透露,初創(chuàng)公司Elorian正在與投資者洽談,計(jì)劃進(jìn)行約5000萬(wàn)美元(約合人民幣3.5億元)的種子輪融資。

該知情人士還說,由風(fēng)投公司CRV前普通合伙人Max Gazor于去年10月創(chuàng)立的風(fēng)險(xiǎn)投資公司Striker Venture Partners正在洽談?lì)I(lǐng)投此輪融資。

結(jié)語(yǔ):視覺推理AI成為巨頭與創(chuàng)企關(guān)注焦點(diǎn)

從最早僅處理文本的大模型,到如今同時(shí)理解圖像、視頻與音頻的多模態(tài)系統(tǒng)。這一被稱為視覺推理的研究領(lǐng)域,如今已成為包括谷歌、OpenAI和Anthropic在內(nèi)的眾多大型AI提供商和初創(chuàng)公司的關(guān)注焦點(diǎn)。

Elorian的出現(xiàn),正是這一浪潮中的縮影,其能否在視覺推理這一關(guān)鍵賽道中跑出差異化路徑,仍有待時(shí)間驗(yàn)證。

來源:The Information