還記得去年的「騰訊優(yōu)圖專場(chǎng)」嗎?智東西公開(kāi)課邀請(qǐng)到瑋劍、太平和棟豪三位騰訊優(yōu)圖實(shí)驗(yàn)室的算法大牛,分別圍繞3D人臉重建、人臉安全和時(shí)序動(dòng)作分析等技術(shù)領(lǐng)域進(jìn)行了直播講解。三講觀看人次累計(jì)超過(guò)9000人次。

今年7月,智東西公開(kāi)課教研團(tuán)隊(duì)全新策劃「大廠講壇」,將邀請(qǐng)國(guó)內(nèi)科技/互聯(lián)網(wǎng)大廠開(kāi)設(shè)專區(qū),圍繞最新研究成果、核心技術(shù)、業(yè)務(wù)創(chuàng)新,持續(xù)帶來(lái)多場(chǎng)直播講解。騰訊優(yōu)圖實(shí)驗(yàn)室專區(qū)則是此次「大廠講壇」的第一個(gè)系列性講解,由AI技術(shù)教研組出品。目前,騰訊優(yōu)圖實(shí)驗(yàn)室專區(qū)進(jìn)展喜人,已經(jīng)確定下來(lái)六講,將圍繞優(yōu)圖實(shí)驗(yàn)室在弱監(jiān)督目標(biāo)定位、圖文多模態(tài)、TNN、高效模型、3D人臉、人臉隱私訓(xùn)練及開(kāi)源項(xiàng)目Tface這六個(gè)領(lǐng)域的重要研究成果進(jìn)行講解和交流。

7月19日晚7點(diǎn),騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員興甲老師將以《弱監(jiān)督目標(biāo)定位的研究及應(yīng)用》為題,率先帶來(lái)「大廠講壇」騰訊優(yōu)圖實(shí)驗(yàn)室專區(qū)第1講的直播講解。

基于全監(jiān)督的目標(biāo)檢測(cè)方法需要耗費(fèi)較大的標(biāo)注成本,對(duì)于任務(wù)更新以及遷移極其不友好。而近年來(lái)相關(guān)研究者試圖從弱監(jiān)督學(xué)習(xí)方面突破標(biāo)注數(shù)據(jù)的限制,為目標(biāo)檢測(cè)尋找一種更加高效、低廉的解決框架。

但自2014年MIT提出的類別響應(yīng)圖CAM,大多數(shù)的弱監(jiān)督目標(biāo)檢測(cè)方法均從空間正則約束方面著手,雖然也提出了一系列方法提高網(wǎng)絡(luò)的響應(yīng)區(qū)域,使其能夠覆蓋目標(biāo)的更多區(qū)域,但是這些工作均忽略了目標(biāo)的結(jié)構(gòu)信息,導(dǎo)致定位的準(zhǔn)確度較低。

而在本次的課程中,興甲老師首先會(huì)對(duì)弱監(jiān)督目標(biāo)定位在近幾年已有的工作進(jìn)行簡(jiǎn)單的介紹總結(jié),包括CAM、ACoL,、DANet,、Rethinking CAM等10篇工作,之后詳解優(yōu)圖實(shí)驗(yàn)室在弱監(jiān)督目標(biāo)定位方面的工作,包括:

(1)發(fā)表在CVPR 2021的工作:保持目標(biāo)的結(jié)構(gòu)是提高目標(biāo)定位精度的關(guān)鍵。首先設(shè)計(jì)了受限激活模塊緩解模型的結(jié)構(gòu)信息彌失的問(wèn)題,之后重新定義了高階相似性的概念并基于此提出了自相關(guān)圖生成模塊用以挖掘目標(biāo)結(jié)構(gòu)信息,顯著提高了目標(biāo)定位精度。

(2)投稿到ICCV 2021的工作:基于Transformer的弱監(jiān)督目標(biāo)定位方法。挖掘目標(biāo)的結(jié)構(gòu)信息,關(guān)鍵在于提取長(zhǎng)距離的特征相似性。相比卷積網(wǎng)絡(luò)有限的感受野,Transformer網(wǎng)絡(luò)中Self-attention機(jī)制保證網(wǎng)絡(luò)具有全局感受野,并且因此可以獲取長(zhǎng)距離特征依賴?;诖耍岢隽艘环N基于Transformer的弱監(jiān)督目標(biāo)定位方法,通過(guò)耦合類別感知圖與類別不可知的注意圖,得到最終的定位結(jié)果,在各個(gè)數(shù)據(jù)集上也取得了很好的效果。

最后,興甲老師也將講解一下弱監(jiān)督目標(biāo)定位在圖像內(nèi)容審核上的簡(jiǎn)單應(yīng)用,主要包括基于混合監(jiān)督的目標(biāo)檢測(cè)方法,以及基于全局+局部特征的圖像檢索應(yīng)用等。

興甲目前是騰訊優(yōu)圖實(shí)驗(yàn)室高級(jí)研究員,主要研究領(lǐng)域?yàn)槟繕?biāo)檢測(cè)與圖像檢索,包括通用目標(biāo)檢測(cè)、旋轉(zhuǎn)目標(biāo)檢測(cè)、弱監(jiān)督/半監(jiān)督目標(biāo)檢測(cè)以及圖像檢索等,負(fù)責(zé)圖像內(nèi)容審核領(lǐng)域的版權(quán)l(xiāng)ogo識(shí)別、同圖檢索等相關(guān)任務(wù)。他曾在CVPR、TIP、TVCG等國(guó)際頂級(jí)會(huì)議、期刊發(fā)表論文6篇,帶隊(duì)獲得了ECCV2018 MVD 實(shí)例分割比賽冠軍。

我們的課程將在智東西公開(kāi)課知識(shí)店鋪上以視頻直播的形式進(jìn)行,包含主講和問(wèn)答兩個(gè)環(huán)節(jié)。主講環(huán)節(jié)40分鐘,問(wèn)答環(huán)節(jié)20分鐘,每個(gè)環(huán)節(jié)主講老師都將通過(guò)視頻直播的形式進(jìn)行實(shí)時(shí)講解與解答。

其他更多「大廠講壇」騰訊優(yōu)圖實(shí)驗(yàn)室專區(qū)的課程信息我們也將陸續(xù)揭曉,大家敬請(qǐng)期待!