「CV研究合輯」,是智東西公開課針對計算機視覺推出的一檔合輯,聚焦于計算機視覺前沿領(lǐng)域研究成果與進展的講解。每一講由主講與答疑兩個環(huán)節(jié)組成,其中,主講60分鐘,采用視頻直播形式,答疑30分鐘,將在相應(yīng)交流群進行。

我們都知道,機器學(xué)習(xí)方法主要可以分為四類,監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、以及強化學(xué)習(xí)。不同于連接主義的監(jiān)督學(xué)習(xí)方法,強化學(xué)習(xí)是智能體通過與環(huán)境的交互,觀測交互結(jié)果以及獲得相應(yīng)的回報。這種學(xué)習(xí)的方式是模擬人或動物的一種學(xué)習(xí)方式,因此強化學(xué)習(xí)在機器人領(lǐng)域有著廣泛的應(yīng)用。

傳統(tǒng)的強化學(xué)習(xí)局限于動作空間和樣本空間都很小,且一般是離散的情境下。然而實際情況的任務(wù)則往往有著很大的狀態(tài)空間和連續(xù)的動作空間。當(dāng)輸入數(shù)據(jù)為圖像,聲音時,往往具有很高維度,傳統(tǒng)的強化學(xué)習(xí)很難處理,此時就需要結(jié)合深度學(xué)習(xí)的方法,將高緯度數(shù)據(jù)進行降維處理,即深度強化學(xué)習(xí)方法。

然而深度強化學(xué)習(xí)到底是什么樣的方法,又有哪些應(yīng)用,尤其在機器人領(lǐng)域又有怎樣的進展呢?北京時間4月11日上午10點(硅谷時間4月10日晚7點、賓夕法尼亞州時間4月10日晚10點),智東西公開課「CV研究合輯」第3講直播開講,由卡內(nèi)基梅隆大學(xué)博士胡亞飛和輕舟智航高級感知工程師陳鈺,為大家講解《深度強化學(xué)習(xí)在機器人領(lǐng)域的研究》。

胡亞飛是卡內(nèi)基梅隆大學(xué)博士,目前在計算機學(xué)院下的機器人系進行研究工作,主要研究方向為動態(tài)場景下的視覺SLAM(包括深度學(xué)習(xí)方法和傳統(tǒng)幾何方法)、強化學(xué)習(xí)在機器人決策與規(guī)劃中的應(yīng)用以及2D/3D多目標(biāo)跟蹤等問題。他曾任ICRA, Autonomous Robot審稿人。

陳鈺是輕舟智航高級感知工程師,工作內(nèi)容主要是多傳感器融合的追蹤;卡內(nèi)基梅隆大學(xué)電子與計算機工程碩士、中山大學(xué)數(shù)據(jù)科學(xué)與計算機學(xué)院本科;曾在阿里巴巴達(dá)摩院機器智能部門、瑞芯微電子核心算法部門實習(xí),有多項美國專利;在CMU MLD Katerina Fragkiadaki實驗室做研究助理;在知乎上撰寫了深度學(xué)習(xí)專欄:CMU 10-703 深度強化學(xué)習(xí)筆記。

CV研究合輯」此前已經(jīng)完結(jié)兩講。第一講由電子科技大學(xué)李文教授主講,主題為《領(lǐng)域適應(yīng)在計算機視覺中的研究和應(yīng)用》;第二講是由小牛動漫資深算法工程師盧薇薇主講的《生成式對抗網(wǎng)絡(luò)GAN在動漫領(lǐng)域的應(yīng)用》。更多講次也已陸續(xù)敲定,會盡快公布。敬請期待。

直播信息

直播時間:4月11日10:00-11:30(北京時間)
直播平臺:智東西公開課小程序
答疑地址:強化學(xué)習(xí)交流群

課程內(nèi)容

主題:深度強化學(xué)習(xí)在機器人領(lǐng)域的研究

提綱:

1、深度強化學(xué)習(xí)的研究進展
2、深度強化學(xué)習(xí)在機器人領(lǐng)域的應(yīng)用
3、仿真器如何解決自動駕駛領(lǐng)域長尾問題
4、imitation learning快速學(xué)習(xí)可操作的駕駛策略
5、使用A3C,DDPG進行smart agent方面的研究

講師介紹

胡亞飛,卡內(nèi)基梅隆大學(xué)博士,目前在計算機學(xué)院下的機器人系進行研究工作;主要研究方向為動態(tài)場景下的視覺SLAM(包括深度學(xué)習(xí)方法和傳統(tǒng)幾何方法),強化學(xué)習(xí)在機器人決策與規(guī)劃中的應(yīng)用,以及2D/3D多目標(biāo)跟蹤等問題;曾任ICRA, Autonomous Robot審稿人。

陳鈺,輕舟智航高級感知工程師,工作內(nèi)容主要是多傳感器融合的追蹤;卡內(nèi)基梅隆大學(xué)電子與計算機工程碩士、中山大學(xué)數(shù)據(jù)科學(xué)與計算機學(xué)院本科;曾在阿里巴巴達(dá)摩院機器智能部門、瑞芯微電子核心算法部門實習(xí),有多項美國專利;在CMU MLD Katerina Fragkiadaki實驗室做研究助理;在知乎上撰寫了深度學(xué)習(xí)專欄: ?CMU 10-703 深度強化學(xué)習(xí)筆記。

申請入群

本次課程的講解分為主講和答疑兩部分,主講以視頻直播形式,答疑將在「強化學(xué)習(xí)交流群」進行。

加入交流群,除了可以免費收聽直播之外,還能認(rèn)識講師,與更多同行和同學(xué)一起學(xué)習(xí),并進行深度討論。

掃碼添加小助手小開(ID:hikai19)即可申請,備注“姓名-公司/學(xué)校/單位-職位/專業(yè)”的朋友將會優(yōu)先審核通過哦~