智東西(公眾號:zhidxcom)
編譯 |? 陳駿達(dá)
編輯 |? Panken

智東西8月1日消息,7月15日,迪士尼公布了一篇16頁的論文,詳細(xì)介紹了他們新型雙足機器人BD-X的主要設(shè)計和控制方法。這個機器人外形酷似《機器人總動員》里的“瓦力”,靈感源自于《星球大戰(zhàn)》中的同名機器人。其硬件采用標(biāo)準(zhǔn)零件和3D打印外殼,腿部有5個自由度,通過強化學(xué)習(xí)掌握了動畫人物的行走姿態(tài),動作靈巧流暢,還鍛煉出跨越復(fù)雜地形的能力

在不久前的IEEE活動上,這個迪士尼機器人還跟杭州宇樹科技的機器狗面對面炫技斗舞。

迪士尼是怎么做雙足機器人的?

▲迪士尼BD-X機器人與宇樹Go2互動(圖源:YouTube)

更早之前,它在今年3月的英偉達(dá)GTC大會上作為驚喜嘉賓壓軸出場,與英偉達(dá)創(chuàng)始人兼CEO黃仁勛親密互動,還搖頭晃腦撒嬌賣萌。

迪士尼是怎么做雙足機器人的?

▲酷似瓦力的BD-X機器人與黃仁勛在GTC大會上互動(圖源:英偉達(dá))

這一機器人以娛樂為目的的設(shè)計理念極大降低了硬件復(fù)雜度與成本。但迪士尼為這臺機器人加上了額外的揚聲器、天線、頭燈和眼睛,這讓它能以更多的方式表現(xiàn)自己的“情緒”。

雖然BD-X看上去活靈活現(xiàn),似乎真的能理解人們說的話,但其實它并不具備主動的感知和行為能力。它的一舉一動都是通過人工操作實現(xiàn)的。這臺機器人配備了來自英偉達(dá)的機載計算機Jetson,能將人類指令與訓(xùn)練時積累的經(jīng)驗結(jié)合,輸出最終的行動指令。

迪士尼是怎么做雙足機器人的?

▲論文首頁截圖(圖源:迪士尼)

論文地址:https://la.disneyresearch.com/publication/design-and-control-of-a-bipedal-robotic-character/

一、機械設(shè)計簡單有效,服務(wù)娛樂與創(chuàng)意目的

迪士尼在設(shè)計BD-X機器人時選擇了與大多數(shù)企業(yè)都不同的路徑。他們并不追求最好、最強大的機械設(shè)計,而是選擇了能夠滿足創(chuàng)意和娛樂目的的簡單設(shè)計。研究者成功集成了動畫內(nèi)容、設(shè)計、控制、實時操縱等元素,并用不到1年的時間實現(xiàn)了定制機器人角色的快速開發(fā)。

這一機器人主要使用了市面上的標(biāo)準(zhǔn)化零件,而外殼則是3D打印的,但經(jīng)過軟件調(diào)試后,仍然可以在降低硬件復(fù)雜度的前提下實現(xiàn)不錯的表現(xiàn)。

迪士尼是怎么做雙足機器人的?

▲迪士尼BD-X機器人設(shè)計圖(圖源:迪士尼)

這一雙足機器人的總重為15.4公斤,高度為0.66米。每條腿上有5個自由度,而頭部與頸部則有4個自由度。腿部的高自由度使得這一機器人能完成大幅度的動作,而頭頸部的高自由度則讓機器人可以通過動作表現(xiàn)各種妙趣橫生、情感豐富的動作。

迪士尼是怎么做雙足機器人的?

▲BD-X機器人在迪士尼樂園亮相,畫面最右側(cè)的二人為操作員(圖源:YouTube)

迪士尼的工程師還通過巧妙的設(shè)計讓機器人能在沒有膝蓋彎曲執(zhí)行器的情況下,依賴與地面的接觸實現(xiàn)逼真的膝蓋彎曲效果。這一機器人配備一塊微控制器驅(qū)動的通訊板,能以600赫茲的頻率實現(xiàn)內(nèi)置電腦、執(zhí)行器和慣性測量單元之間的通訊。1塊可拆卸電池為機器人供電,能維持至少1個小時的運轉(zhuǎn)時間。

有趣的是,除了頭部和軀干上配備的揚聲器,這臺機器人還有具備執(zhí)行器的天線、能點亮的眼睛和一盞頭燈。這些設(shè)備為機器人提供了更多表現(xiàn)情緒的方式,同時其控制和驅(qū)動都是相對獨立的,因此可以選擇是否搭載這些功能。

二、利用強化學(xué)習(xí)掌握動畫動作,在英偉達(dá)Isaac Gym中模擬訓(xùn)練

為了給機器人動作提供一個清晰的框架,迪士尼的研究人員將機器人的動作分為以下3類。

1、持續(xù)性動作:沒有明確的起點和終點。機器人保持平衡,并對測量到的狀態(tài)和連續(xù)的控制輸入流做出響應(yīng)。

2、周期性運動:有一個周期性的相位信號傳遞給策略。在這種模式下,相位信號無限循環(huán)。

3、偶發(fā)性運動:有預(yù)定的持續(xù)時間。策略接收單調(diào)遞增的相位信號,一旦運動結(jié)束,就會強制過渡到新的運動。

迪士尼是怎么做雙足機器人的?

▲BD-X機器人的3種運動類型(圖源:迪士尼)

機器人的控制策略是機器人學(xué)中的重要概念,指的是將機器人的狀態(tài)映射為動作或電機命令的函數(shù),使機器人能實現(xiàn)預(yù)期的行為和任務(wù)。

研究人員讓BD-X機器人通過強化學(xué)習(xí)的方式掌握了多種控制策略,分別針對上述3種類型的動作。

根據(jù)機器人的CAD模型,迪士尼的研究人員構(gòu)建出了這一機器人的準(zhǔn)確物理形態(tài)、執(zhí)行器和它與環(huán)境的互動,并通過英偉達(dá)的機器人訓(xùn)練平臺Isaac Gym模擬出這一機器人的剛體動力學(xué)特征。研究人員還通過定制的執(zhí)行器模型進(jìn)一步模擬了這一機器人的完整動力學(xué)特征。

迪士尼是怎么做雙足機器人的?

▲BD-X模擬訓(xùn)練系統(tǒng)(圖源:迪士尼)

BD-X機器人的動作是根據(jù)動畫內(nèi)容學(xué)習(xí)的。迪士尼的研究人員提取了動畫中人物的特定動作指標(biāo),如軀干的全局位置、關(guān)節(jié)的位置和矢量等信息,這些信息將用來訓(xùn)練這一BD-X機器人模仿動畫中的動作。

在Isaac Gym的模擬訓(xùn)練中,機器人會收到強化學(xué)習(xí)系統(tǒng)的獎勵和懲罰。這一系統(tǒng)會考慮動作與動畫人物的相似度、動作的規(guī)范程度(如有無關(guān)節(jié)扭曲、動作是否流暢)以及機器人是否生存(“死亡”被定義為頭和軀干與地面接觸,或頭和軀干碰撞),并給出相應(yīng)的獎懲。

訓(xùn)練過程中,系統(tǒng)還會模擬出隨機的擾動、牽引力還有不同的地貌,這提升了機器人的魯棒性(Robustness,指抗干擾性或穩(wěn)定性)。

三、并無主動感知和行動能力,通過復(fù)雜控制器實現(xiàn)運動

迪士尼的研究人員稱,在發(fā)布這篇論文時,BD-X機器人已經(jīng)有過累計10小時的公開展示運行時間,在這10小時里這一機器人表現(xiàn)完美,一次都沒有摔倒。許多觀眾都被這一機器人可愛的外表吸引,而未注意到這一機器人的操縱者。

實際上,BD-X機器人并無任何主動的行為和感知能力,其動作都是通過專業(yè)人員操縱一個復(fù)雜的控制器實現(xiàn)的。在運行期間,操作員可以使用直觀的遙控互動界面控制這一機器人。這一操縱設(shè)備較為復(fù)雜,有2個搖桿、2塊路徑板,正反面總計有十幾個按鍵。

迪士尼是怎么做雙足機器人的?

▲BD-X通過控制器實現(xiàn)靈動的動作(圖源:迪士尼)

在虛擬訓(xùn)練結(jié)束后,神經(jīng)控制策略的權(quán)重被凍結(jié),策略網(wǎng)絡(luò)被部署到機器人的機載計算機Jetson上。部署后的控制策略和低層次控制器直接與機器人的硬件交互,還能融入慣性測量單元和執(zhí)行器的測量數(shù)據(jù)。

機器人內(nèi)置的動畫引擎能自動將操作員輸入的指令,與機器人內(nèi)置的策略控制命令、展示功能信號(天線、眼睛、頭燈的控制信號)和聲音信號結(jié)合起來,為控制策略生成最終指令。

迪士尼是怎么做雙足機器人的?

▲操作員在英偉達(dá)GTC 2024的后臺調(diào)試BD-X機器人(圖源:YouTube)

人工操縱指令和內(nèi)置策略控制命令的結(jié)合能避免機器人出現(xiàn)訓(xùn)練過程中研究人員希望規(guī)避的動作,如摔倒、動作僵硬不流暢等等。

迪士尼是怎么做雙足機器人的?

▲BD-X機器人展現(xiàn)出很強的魯棒性,能在多種復(fù)雜地面情況下保持穩(wěn)定(圖源:迪士尼)

展示功能和音頻是機器人的受控元素,在表現(xiàn)角色方面起著關(guān)鍵作用,但不會影響系統(tǒng)的動態(tài)。它們的行為通過動畫引擎發(fā)出的動畫信號和狀態(tài)反饋與機器人的運動同步。

結(jié)語:AI讓動畫人物走進(jìn)現(xiàn)實,“不實用”的機器人也有價值

其實迪士尼是機器人領(lǐng)域的資深玩家,從上世紀(jì)60年代以來他們就一直深耕機器人相關(guān)研究,并且在迪士尼樂園中嘗試部署他們的研究成果,探索讓動畫人物走進(jìn)現(xiàn)實世界的各種方式和場景。

迪士尼是怎么做雙足機器人的?

▲迪士尼過去在機器人領(lǐng)域的相關(guān)研究(圖源:迪士尼)

AI技術(shù)的發(fā)展讓機器人的一舉一動都更為逼真自然,而強化學(xué)習(xí)讓專業(yè)動畫師制作的人物動作在現(xiàn)實中落地。雖然BD-X機器人并不像其它雙足機器人那樣能進(jìn)工廠、上流水線,但我們也樂見娛樂目的的機器人技術(shù)進(jìn)一步發(fā)展,讓普通人也能享受到機器人帶來的快樂。

來源:迪士尼