「AI新青年講座」將邀請世界頂尖AI研究機(jī)構(gòu)和大學(xué)的科研新青年,主講他們在計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)等人工智能領(lǐng)域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進(jìn)對人工智能前沿研究的理解,相應(yīng)領(lǐng)域的專業(yè)知識也能夠得以積累加深。同時(shí),通過與AI新青年的直接交流,大家在AI學(xué)習(xí)和應(yīng)用AI的過程中遇到的問題,也能夠盡快解決。

有興趣分享學(xué)術(shù)成果的朋友,可以與智東西公開課教研團(tuán)隊(duì)進(jìn)行郵件(class@zhidx.com)聯(lián)系。

無監(jiān)督單目深度估計(jì)算法僅使用無需標(biāo)注的單目視頻作為訓(xùn)練數(shù)據(jù)就能在測試時(shí)提供較為準(zhǔn)確的場景深度信息,因此這類算法自提出以來就廣泛受到學(xué)術(shù)界和工業(yè)界的關(guān)注。然而目前大部分方法僅在自動(dòng)駕駛場景(開車視頻上)證明了良好的性能,將其用于室內(nèi)VR/AR場景則表現(xiàn)一般或可能失敗。

雖然低紋理等因素會(huì)使得算法更難在室內(nèi)場景訓(xùn)練,但是牛津大學(xué)博士后研究員邊佳旺等人認(rèn)為復(fù)雜的相機(jī)運(yùn)動(dòng)才是更關(guān)鍵的原因。比如,在自動(dòng)駕駛場景中相機(jī)一般被固定在車上穩(wěn)定前行,而在室內(nèi)VR/AR場景中相機(jī)會(huì)隨著人(或手)無規(guī)律運(yùn)動(dòng)。基于這一假設(shè),邊佳旺博士首先對相機(jī)運(yùn)動(dòng)與深度估計(jì)的聯(lián)系作出理論分析,然后提出數(shù)據(jù)預(yù)處理的方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,最后提出自校準(zhǔn)網(wǎng)絡(luò)實(shí)現(xiàn)可以端到端訓(xùn)練的無監(jiān)督深度估計(jì)算法SC-Depth。

基于自校準(zhǔn)網(wǎng)絡(luò)(ARN)來解決復(fù)雜的相機(jī)旋轉(zhuǎn)問題,并將其嵌入到深度估計(jì)訓(xùn)練框架SSC-Depth中實(shí)現(xiàn)端到端訓(xùn)練。最終SC-DepthV2在NYUv2、Make3D、Scannet等多個(gè)數(shù)據(jù)集上大幅超過現(xiàn)有算法。

7月6日晚7點(diǎn),「AI新青年講座」第134講,牛津大學(xué)博士后研究員邊佳旺博士將主講《室內(nèi)單目深度估計(jì)中的復(fù)雜相機(jī)位姿》。

講者

邊佳旺,牛津大學(xué)博士后研究員,博士就讀于澳大利亞阿德萊德大學(xué),導(dǎo)師為Ian Reid和沈春華教授。本科畢業(yè)于南開大學(xué),在程明明教授課題組研究學(xué)習(xí)。主要研究三維計(jì)算機(jī)視覺方面難題,具體研究方向包括圖像特征匹配,視覺SLAM,三維重建,單目深度估計(jì),和無/自監(jiān)督學(xué)習(xí)等,在CVPR、NeurIPS、IJCV、TPAMI等國際頂級會(huì)議和期刊上發(fā)表十余篇高質(zhì)量文章。

主題

《室內(nèi)單目深度估計(jì)中的復(fù)雜相機(jī)位姿》

提綱

1、無監(jiān)督單目深度估計(jì)算法解析
2、相機(jī)運(yùn)動(dòng)與深度估計(jì)的關(guān)系
3、解決室內(nèi)復(fù)雜相機(jī)運(yùn)動(dòng)的自校準(zhǔn)估計(jì)算法SC-DepthV2

課程信息

直播時(shí)間:7月6日19:00
直播地點(diǎn):智東西公開課知識店鋪

論文成果

SC-DepthV2:《Auto-Rectify Network for Unsupervised IndoorDepth Estimation》

論文鏈接:https://arxiv.org/abs/2006.02708

開源地址:https://github.com/JiawangBian/sc_depth_pl