智東西(公眾號(hào):zhidxcom)
編譯 |?徐珊
編輯 |?云鵬

智東西7月16日消息,據(jù)外媒Tech Xplore報(bào)道,南加州大學(xué)的研究團(tuán)隊(duì)在2021年學(xué)習(xí)代表國際會(huì)議發(fā)表了名為《基于組監(jiān)督和零樣本的學(xué)習(xí)(Zero-Shot Synthesis with Group-Supervised Learning)》的論文,他們正在研究如何讓AI模仿人類的想象過程,以合成或了解從未見過的事物。

當(dāng)我們?nèi)ハ胂笠恢回堅(jiān)陂L城上奔跑時(shí),我們大腦中的一系列神經(jīng)元將會(huì)被快速激活,然后在大腦中呈現(xiàn)不同的圖像。這個(gè)想象的過程對人類來說很簡單,對于深度神經(jīng)網(wǎng)絡(luò)系統(tǒng)來說很難。盡管它在某些領(lǐng)域中取得了超過人類的表現(xiàn),但該系統(tǒng)仍難以做到人類的“想象”。

研究人員通過解耦(Disentanglement)技術(shù)讓AI產(chǎn)生與人類相似的“想象力”,以合成不同屬性的、前所未見的物體。研究人員認(rèn)為,這項(xiàng)技術(shù)不但可以協(xié)助人們合成新藥,而且還能提高自動(dòng)駕駛汽車的安全性,并且讓人工智能消除數(shù)據(jù)算法帶來的潛在偏見。

“我們受到人類視覺概括能力(human visual generalization capabilities)的啟發(fā),試圖在AI中模擬人類的想象”,該研究的第一作者(lead author)葛云皓說,“人類可以按屬性(例如形狀、姿勢、位置、顏色)將他們已知的信息分類,然后將它們重新組合去想象一個(gè)新的事物。我們的研究主要通過神經(jīng)網(wǎng)絡(luò)系統(tǒng)模擬這個(gè)過程。”

一、AI難以分清事物的屬性特征

事實(shí)上,如果你想讓一個(gè)AI可以自行生成一張汽車圖像,理想情況下,您可以通過為這個(gè)AI提供幾張汽車的圖像,它就可以從顏色、類型等角度生成多種類型的汽車,如紅色的保時(shí)捷,綠色的皮卡等。

完成這類的任務(wù)是人們設(shè)計(jì)AI的長期目標(biāo)之一——AI創(chuàng)建可以推斷的模型(models that can extrapolate)。這意味著當(dāng)人們給AI幾個(gè)樣本時(shí),AI就應(yīng)該能從這些樣本中提取基本的共性,并將它們應(yīng)用于大量的新事物中,即便AI此前從未見過這樣的事物。但是目前AI最常接受的樣本特征訓(xùn)練是像素等,這些并不需要考慮對象的屬性。

比如說,長方形的木板,具有長方形、木質(zhì)、板等屬性,但AI并不清楚長方形的木板有哪些屬性,它只能從給定的一些木板圖片中提取事物的共性如木板長度相同,而這些共性不一定都是事物的屬性。因此目前大部分AI模型都難以分清事物的屬性特征。

二、通過“解耦”讓AI理解事物屬性

在該項(xiàng)目中,研究人員試圖使用“解耦”的概念來克服AI模型難以分清研究對象不同屬性的難題。

簡單來說,解耦是指就是當(dāng)你直接替換事物的某個(gè)特性時(shí),對原來事物的理解不造成影響。

比如說,你有一臺(tái)黑色的電腦,并且從未見過黑色的水杯,但是你知道水杯是什么樣的。你會(huì)將從黑色的電腦上知道什么是黑色的,?然后將這個(gè)概念應(yīng)用于水杯上,你就知道黑色的水杯是什么樣的。在這個(gè)過程中,你就實(shí)現(xiàn)了“解耦”。

讓AI擁有人類的“想象力”!深度神經(jīng)網(wǎng)絡(luò)新突破,或用于合成藥物

▲來源:Tech Xplore

與傳統(tǒng)算法一次只分析一個(gè)樣本不同,AI學(xué)習(xí)拆解事物的屬性需要通過解耦技術(shù)分析一組樣本圖像,并挖掘它們之間的相似性,實(shí)現(xiàn)“可控解開表征學(xué)習(xí)(controllable disentangled representation learning)”。然后,AI將重新組合這些屬性信息,以實(shí)現(xiàn)“可控的新圖像合成(controllable novel image synthesis)”,或者可以叫做“想象力”。

葛云皓以變形金剛為例解釋,“AI可以采用威震天的形狀,大黃蜂的外觀和動(dòng)作,以及紐約時(shí)代廣場的背景進(jìn)行‘想象’。最終,即使在此前訓(xùn)練期間AI從未見過這個(gè)場景,它也將呈現(xiàn)這樣的一幅畫面:在時(shí)代廣場,黃色的威震天做著大黃蜂標(biāo)準(zhǔn)動(dòng)作?!?/p>

這樣的想象方式有點(diǎn)類似于人類的推斷行為,當(dāng)人們看到一個(gè)物體的顏色時(shí),我們可以用新顏色替換原始顏色,并輕松地將輕松地推斷這個(gè)顏色的其他物體會(huì)是什么樣的。

解耦還可以應(yīng)用于深度偽造技術(shù)(deepfakes)。例如,將人臉的運(yùn)動(dòng)和人的身份分開,AI模型可以將A的身份替換為B,但保留A的動(dòng)作,合成新的圖像和視頻。

此外,在進(jìn)行該項(xiàng)研究時(shí),該研究團(tuán)隊(duì)生成了一個(gè)156萬張的圖像數(shù)據(jù)集(dataset),可以幫助相關(guān)領(lǐng)域的研究團(tuán)隊(duì)開展研究。

三、拆開后重組事物屬性后,“解耦”可協(xié)助研發(fā)新藥

雖然解耦并不是一個(gè)有關(guān)AI“想象力”的新設(shè)想,但研究人員表示,他們的設(shè)計(jì)框架可以讓AI適應(yīng)于大多數(shù)的數(shù)據(jù)和知識(shí)領(lǐng)域,這將擴(kuò)大AI“想象”的應(yīng)用范圍。此外,AI還可以從相關(guān)信息中完全抹除種族、性別等容易造成歧視的屬性,讓人們的信息在被數(shù)據(jù)分析時(shí),得到相同的處理方式。

在醫(yī)學(xué)領(lǐng)域,學(xué)會(huì)分辨屬性的AI可以幫助醫(yī)生和生物學(xué)家發(fā)現(xiàn)更多有用的藥物。AI將藥物的功能與藥物的其他特性分開,然后將不同藥物的特性重新組合,以合成新藥。

不僅如此,當(dāng)AI具有“想象力”后,它還可以幫助創(chuàng)建更安全的人工智能。比如說,它讓自動(dòng)駕駛汽車“想象”如何避開訓(xùn)練中從未遇見的危險(xiǎn)場景。

“深度學(xué)習(xí)在很多領(lǐng)域都展示了較大的前景,但這些往往通過讓AI淺層模仿(shallow mimicry)人類行為發(fā)生的,這些技術(shù)并沒有更深入地了解每個(gè)研究對象獨(dú)一無二的屬性特征”,計(jì)算機(jī)科學(xué)教授Laurent Itti說,“第一次真正地釋放了人工智能的想象力,使它們能更加理解人類是如何看待世界的”。

結(jié)語:AI解耦或成“雙刃劍”

南加州大學(xué)的研究團(tuán)隊(duì)通過解耦技術(shù),讓AI能夠分清事物的不同屬性。并且,AI可以將不同事物的屬性重新組合,形成以前從未見過的事物。該技術(shù)還可以讓自動(dòng)駕駛汽車避開從未遇見過的危險(xiǎn)前景,以及協(xié)助合成新藥物。

當(dāng)AI學(xué)會(huì)了如何拆解事物的屬性之后,可以重新幫助人們了解事物的多樣性,提高人們對事物認(rèn)知。但是當(dāng)AI解耦應(yīng)用于造假時(shí),又將給人們造成一定危害。AI解耦技術(shù)或成為一把“雙刃劍”,而人們在利用AI技術(shù)優(yōu)勢時(shí),如何掌控好技術(shù)的“韁繩”,人們還將繼續(xù)探索。

來源:Tech Xplore