「AI新青年講座」將邀請(qǐng)世界頂尖AI研究機(jī)構(gòu)和大學(xué)的科研新青年,主講他們?cè)谟?jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進(jìn)對(duì)人工智能前沿研究的理解,相應(yīng)領(lǐng)域的專業(yè)知識(shí)也能夠得以積累加深。同時(shí),通過(guò)與AI新青年的直接交流,大家在AI學(xué)習(xí)和應(yīng)用AI的過(guò)程中遇到的問(wèn)題,也能夠盡快解決。

有興趣分享學(xué)術(shù)成果的朋友,可以與智東西公開課教研團(tuán)隊(duì)進(jìn)行郵件(class@zhidx.com)聯(lián)系。

近年來(lái),計(jì)算機(jī)視覺領(lǐng)域的新型架構(gòu)層出不窮,包括視覺 Transformer、MLP 等。它們?cè)诤芏嗳蝿?wù)上都取得了超越 CNN 的性能,受到廣泛關(guān)注。其中,視覺 MLP 具有極其簡(jiǎn)單的架構(gòu),僅由多層感知器(MLP)堆疊而成。與 CNN 和 Transformer 相比,這些簡(jiǎn)潔的 MLP 架構(gòu)引入了更少的歸納偏置,具有更強(qiáng)的泛化性能。

然而,現(xiàn)有視覺 MLP 架構(gòu)的性能依然弱于 CNN 和 Transformer。受量子力學(xué)中波粒二象性的啟發(fā),來(lái)自華為諾亞方舟實(shí)驗(yàn)室、北京大學(xué)、悉尼大學(xué)的研究者提出了一種新型視覺 MLP 架構(gòu)——Wave-MLP。

波粒二象性是量子力學(xué)中的一個(gè)基本屬性,指的是所有的個(gè)體(比如電子、光子、原子等)都可以同時(shí)使用粒子的術(shù)語(yǔ)和波的術(shù)語(yǔ)來(lái)描述。一個(gè)波通常包括幅值和相位兩個(gè)屬性,幅值表示一個(gè)波可能達(dá)到的最大強(qiáng)度,相位指示著當(dāng)前處在一個(gè)周期的哪個(gè)位置。將一個(gè)經(jīng)典意義上的粒子用波(比如,德布羅意波)的形式來(lái)表示,可以更完備地描述微觀粒子的運(yùn)動(dòng)狀態(tài)。

Wave-MLP受量子力學(xué)中波粒二象性的啟發(fā),將 MLP 中每個(gè)圖像塊 (Token) 表示成波函數(shù)的形式。相比現(xiàn)有的視覺 Transformer 和 MLP 架構(gòu),Wave-MLP 有著明顯的性能優(yōu)勢(shì)。在 ImageNet,Wave-MLP-S 模型上以 4.5G FLOPs 實(shí)現(xiàn)了 82.6% 的 top-1 準(zhǔn)確率,比相似計(jì)算代價(jià)的 Swin-T 高 1.3 個(gè)點(diǎn)。此外,Wave-MLP 也可以推廣到目標(biāo)檢測(cè)和語(yǔ)義分割等下游任務(wù),展現(xiàn)出強(qiáng)大的泛化性能。

6月7日,「AI新青年講座」第122講邀請(qǐng)到Wave-MLP一作、北京大學(xué)智能學(xué)院在讀博士唐業(yè)輝參與,主講《量子啟發(fā)的新型視覺主干模型WaveMLP》。

講者
唐業(yè)輝,北京大學(xué)智能學(xué)院在讀博士,主要研究方向是面向計(jì)算機(jī)視覺的主干模型設(shè)計(jì)及高效部署;在NeurIPS、CVPR、ICCV等頂級(jí)會(huì)議上發(fā)表多篇論文。

第122講

主 題
《量子啟發(fā)的新型視覺主干模型WaveMLP》

提 綱
1、視覺領(lǐng)域的新型架構(gòu)研究
2、基于多層感知器的簡(jiǎn)潔型視覺MLP架構(gòu)
3、受量子力學(xué)啟發(fā)的新型視覺MLP架構(gòu)WaveMLP
4、拓展:極簡(jiǎn)的視覺主干模型

直 播 信 息
直播時(shí)間:6月7日19:00
直播地點(diǎn):智東西公開課知識(shí)店鋪

成果
WaveMLP:《An Image Patch is a Wave: Quantum Inspired Vision MLP》
論文鏈接:https://arxiv.org/abs/2111.12294.pdf
PyTorch 代碼:https://github.com/huawei-noah/CV-Backbones/tree/master/wavemlp_pytorch
MindSpore 代碼:https://gitee.com/mindspore/models/tree/master/research/cv/wave_mlp