智猩猩是智一科技打造的硬科技講解與服務(wù)平臺(tái),關(guān)注AI、芯片、算力、智能網(wǎng)聯(lián)汽車、機(jī)器人,提供講座、公開課、在線研討會(huì)、峰會(huì)等線上線下產(chǎn)品。
「機(jī)器人新青年講座」由智猩猩全新企劃,旨在邀請(qǐng)全球知名高校、頂尖研究機(jī)構(gòu)以及優(yōu)秀企業(yè)的青年學(xué)者與研究人員,主講在具身智能、強(qiáng)化學(xué)習(xí)、多智能體系統(tǒng)、建模仿真等機(jī)器人關(guān)鍵技術(shù)上的研究成果和開發(fā)實(shí)踐。
有興趣講解的朋友,可以與智猩猩教研產(chǎn)品團(tuán)隊(duì)郵件(class@zhidx.com)聯(lián)系。
機(jī)器人學(xué)習(xí)是具身智能領(lǐng)域中一項(xiàng)重要的研究課題?;谀P偷膹?qiáng)化學(xué)習(xí)(Model-based RL)是智能體在對(duì)周圍環(huán)境進(jìn)行建模的基礎(chǔ)上進(jìn)行各類操作學(xué)習(xí),相較于無模型的強(qiáng)化學(xué)習(xí)(Model-Free RL)被認(rèn)為在樣本效率方面具有顯著優(yōu)勢(shì)。然而,如何更高效、精準(zhǔn)、自動(dòng)化地從原始傳感器信號(hào)(例如圖像信息)中建立對(duì)周邊環(huán)境的建模,并基于此學(xué)習(xí)操作技巧一直以來都是一個(gè)具有挑戰(zhàn)性的問題。
針對(duì)當(dāng)前基于模型的強(qiáng)化學(xué)習(xí)所面臨的困境,上海交大盧策吾老師團(tuán)隊(duì)提出一種可以主動(dòng)提高感知質(zhì)量、基于模型的機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)SAM-RL。

SAM-RL可以對(duì)周圍環(huán)境進(jìn)行建模并在操作過程中對(duì)模型進(jìn)行更新(Real2Sim),在模型中學(xué)習(xí)各類操作機(jī)器(Learn@Sim);并將學(xué)習(xí)到的技巧遷移到現(xiàn)實(shí)中去(Sim2Real)。為了更精準(zhǔn)的對(duì)環(huán)境進(jìn)行建模,SAM-RL系統(tǒng)還可以使用機(jī)械臂控制相機(jī),主動(dòng)地選擇信息更為豐富的相機(jī)視角。我們?cè)谔摂M與真實(shí)環(huán)境中的三個(gè)不同任務(wù)上應(yīng)用了SAM-RL,展示出了不錯(cuò)的樣本效率與性能。
與SAM-RL相關(guān)的論文成果收錄于RSS 2023頂會(huì)上,并被提名為Best System Paper,是國內(nèi)論文在該會(huì)議中首次獲得提名。

1月30日19點(diǎn),智猩猩邀請(qǐng)到論文一作、上海交通大學(xué)MVIG實(shí)驗(yàn)室在讀博士呂峻參與「機(jī)器人新青年講座」,主講《基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)》。
講者
呂峻,上海交通大學(xué)MVIG實(shí)驗(yàn)室在讀博士
師從盧策吾老師,入選上海交通大學(xué)吳文俊人工智能榮譽(yù)博士班,在RSS、CoRL、ICRA、CVPR等學(xué)術(shù)會(huì)議發(fā)表論文7篇,曾獲得2023年RSS最佳系統(tǒng)論文獎(jiǎng)提名。
第1講
主 題
《基于模型的主動(dòng)感知機(jī)器人強(qiáng)化學(xué)習(xí)系統(tǒng)》
提 綱
1、基于模型的機(jī)器人學(xué)習(xí)面臨的問題
2、基于可微分仿真與渲染的有模型強(qiáng)化學(xué)習(xí)
3、主動(dòng)提高感知質(zhì)量的算法框架SAM-RL
4、在虛擬與真實(shí)環(huán)境中的應(yīng)用
直 播 信 息
直播時(shí)間:1月30日19:00
直播地點(diǎn):智猩猩知識(shí)店鋪
成果
論文標(biāo)題
《SAM-RL: Sensing-Aware Model-Based Reinforcement Learning viaDifferentiable Physics-Based Simulation and Rendering》
論文鏈接
https://arxiv.org/abs/2210.15185
開源地址
https://sites.google.com/view/rss-sam-rl
報(bào)名方式
對(duì)本次講座感興趣朋友,可以掃描下方二維碼,添加小助手莓莓進(jìn)行報(bào)名。已添加過莓莓的老朋友,可以給莓莓私信,發(fā)送“機(jī)器人講座01”即可報(bào)名。
我們會(huì)為審核通過的朋友推送直播鏈接。同時(shí),本次講座也組建了學(xué)習(xí)群,直播開始前會(huì)邀請(qǐng)審核通過的相關(guān)朋友入群交流。
