「自動(dòng)駕駛新青年講座」由智東西公開(kāi)課全新企劃,將邀請(qǐng)全球知名高校、頂尖研究機(jī)構(gòu)以及優(yōu)秀企業(yè)的新青年,主講在環(huán)境感知、精準(zhǔn)定位、決策規(guī)劃、控制執(zhí)行等自動(dòng)駕駛關(guān)鍵技術(shù)上的最新研究成果和開(kāi)發(fā)實(shí)踐。

有興趣分享的朋友,可以與智東西公開(kāi)課教研團(tuán)隊(duì)進(jìn)行郵件(class@zhidx.com)聯(lián)系。

決策是自動(dòng)駕駛系統(tǒng)中至關(guān)重要的一環(huán),是決定自動(dòng)駕駛汽車大規(guī)模部署的前沿問(wèn)題。相比于傳統(tǒng)的基于規(guī)則的決策方法,基于學(xué)習(xí)的決策方法可以大大增強(qiáng)系統(tǒng)的可擴(kuò)展性,從而加速自動(dòng)駕駛汽車在現(xiàn)實(shí)復(fù)雜道路情況下的開(kāi)發(fā)和部署。然而,目前仍缺乏對(duì)基于學(xué)習(xí)的自動(dòng)駕駛決策過(guò)程的系統(tǒng)總結(jié)。

來(lái)自南洋理工大學(xué)的AutoMan實(shí)驗(yàn)室的在讀博士黃志宇等人專注于自動(dòng)駕駛決策、預(yù)測(cè)規(guī)劃領(lǐng)域的研究。他們?cè)谧钚碌难芯恐欣媚鎻?qiáng)化學(xué)習(xí)(Inverse reinforcement learning)評(píng)估決策,結(jié)合模仿學(xué)習(xí)(Imitation learning)和強(qiáng)化學(xué)習(xí)(Reinforcement learning)直接生成決策,以及學(xué)習(xí)世界模型(World model)用于決策。

11月29日晚7點(diǎn),「自動(dòng)駕駛新青年講座」第12講邀請(qǐng)到南洋理工大學(xué)在讀博士黃志宇,主講《自動(dòng)駕駛智能決策生成算法解析》。

本次講座中,黃博將基于個(gè)人的研究工作,全面講解基于學(xué)習(xí)的決策系統(tǒng)框架以及其中各模塊的學(xué)習(xí)方法,之后重點(diǎn)將講解學(xué)習(xí)世界模型對(duì)真實(shí)世界交通場(chǎng)景中的人類交互行為進(jìn)行建模,并以此做出更加智能和擬人化的決策。

講者
黃志宇,南洋理工大學(xué)在讀博士;研究方向?yàn)樽詣?dòng)駕駛決策、預(yù)測(cè)規(guī)劃及人機(jī)交互;在TNNLS、TITS、ICRA/IV等相關(guān)領(lǐng)域頂級(jí)期刊和會(huì)議發(fā)表多篇論文;曾獲2021年Waymo開(kāi)放數(shù)據(jù)集挑戰(zhàn)賽交互預(yù)測(cè)冠軍,運(yùn)動(dòng)預(yù)測(cè)亞軍以及2022年Occupancy Flow預(yù)測(cè)亞軍。

第12講
主 題
《自動(dòng)駕駛智能決策生成算法解析》

提 綱
1、基于學(xué)習(xí)的決策系統(tǒng)框架
2、逆強(qiáng)化學(xué)習(xí)評(píng)估決策
3、結(jié)合強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)的決策生成
4、學(xué)習(xí)世界模型對(duì)人類交互行為建模及決策生成

直 播 信 息
直播時(shí)間:11月29日19:00
直播地點(diǎn):智東西公開(kāi)課知識(shí)店鋪

成果

論文標(biāo)題
《Driving behavior modeling using naturalistic human driving data with inverse reinforcement learning》
《Efficient deep reinforcement learning with imitative expert priors for autonomous driving》
《Differentiable integrated motion prediction and planning with learnable cost function for autonomous driving》

論文地址
https://arxiv.org/abs/2010.03118
https://arxiv.org/abs/2103.10690
https://arxiv.org/abs/2207.10422

開(kāi)源地址
https://github.com/MCZhi/Driving-IRL-NGSIM
https://github.com/MCZhi/Expert-Prior-RL
https://github.com/MCZhi/DIPP