智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西2月5日報道,具身智能機(jī)器人如何走向落地?機(jī)器人是否需要專用芯片?近日,英特爾研究院副總裁、英特爾中國研究院院長宋繼強(qiáng)與智東西等媒體進(jìn)行深入交流,分享了對這些問題的思考。

英特爾在機(jī)器人及控制技術(shù)體系的實(shí)踐中認(rèn)識到,不存在能夠解決所有復(fù)雜場景問題的“萬能鑰匙”或單一技術(shù)范式。真正的完整解決方案,必然是通過前瞻性地融合創(chuàng)新技術(shù)與經(jīng)過驗(yàn)證的成熟方法,將其系統(tǒng)性地工程化,這樣才能穩(wěn)健落地。

宋繼強(qiáng)認(rèn)為,很難用一種硬件滿足不同的操作復(fù)雜度、實(shí)時性、計算和感知要求,因此異構(gòu)計算非常重要。

英特爾面向邊緣的第三代酷睿Ultra處理器便能發(fā)揮出XPU架構(gòu)優(yōu)勢,綜合AI算力達(dá)到180TOPS,并采用Intel 18A制程,能效比更高,同時可使用OpenVINO等AI庫以及面向邊緣的軟件SDK。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

與消費(fèi)級、商用級酷睿的側(cè)重點(diǎn)不同,它強(qiáng)調(diào)工業(yè)級要求,例如溫寬、耐用性、10年可靠性,同時增強(qiáng)了機(jī)器人及工業(yè)領(lǐng)域要求的高實(shí)時性、高確定性。

其機(jī)器人AI套件每個季度都會升級,具身智能SDK新增了對大語言模型的支持,同時把EtherCAT支持納入軟件棧,并補(bǔ)齊對實(shí)時庫的支持。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

英特爾與合作伙伴共同開發(fā)了一款機(jī)器人AI板級套件。這塊板卡體積小、功耗控制在機(jī)器人本體可承受范圍內(nèi),能跑傳統(tǒng)視覺模型,也能跑優(yōu)化過的大模型,可滿足機(jī)器人常規(guī)的感知、規(guī)劃與操控應(yīng)用,也能通過互聯(lián)平臺與邊緣AI設(shè)備連接,提供擴(kuò)展的模型能力。

一、機(jī)器人專用芯片尚早,業(yè)界普遍用手機(jī)/汽車芯片改造

機(jī)器人會像手機(jī)、汽車一樣有專用芯片嗎?宋繼強(qiáng)認(rèn)為,技術(shù)上不難,商業(yè)上太早。

當(dāng)前機(jī)器人領(lǐng)域使用的芯片,大多并非專門為機(jī)器人設(shè)計,而是對手機(jī)、汽車、PC等成熟平臺的芯片進(jìn)行改造適配。這主要是由于機(jī)器人產(chǎn)業(yè)規(guī)模尚小,設(shè)計專用芯片難以實(shí)現(xiàn)商業(yè)盈利。

更深層的原因是,機(jī)器人本身的技術(shù)路徑和主流負(fù)載尚未定型,因此業(yè)界普遍先采用通用平臺進(jìn)行過渡和驗(yàn)證。

設(shè)計一款機(jī)器人專用芯片本身并不困難,只要有明確的系統(tǒng)級規(guī)格,大約10個月即可完成設(shè)計流片,18個月左右能完成測試。難點(diǎn)在于先定下來如果讓業(yè)務(wù)真正跑起來,需要系統(tǒng)支持哪些能力。

英特爾的機(jī)會,也正在于此。

在傳統(tǒng)工業(yè)機(jī)器人的運(yùn)動控制、高精度浮點(diǎn)計算、逆運(yùn)動學(xué)求解等場景中,憑借高可靠性的工業(yè)控制板和豐富的視覺庫,英特爾已有長期經(jīng)驗(yàn)積累。大部分機(jī)器人工控板都是用英特爾處理器做的。

目前英特爾正與一些具身智能機(jī)器人廠商合作。這些伙伴尤其需要英特爾提供的能力,就是實(shí)時性與控制精度,包括如何在一個系統(tǒng)里保證需要實(shí)時、快速響應(yīng)的部分不被其他任務(wù)搶占資源。

英特爾能夠告訴具身智能機(jī)器人廠商做上層任務(wù)時,如何處理、分配、調(diào)度底層CPU核、內(nèi)存、I/O等資源,才能保證最終需要的實(shí)時性達(dá)標(biāo)和物理風(fēng)險上可控、可信賴。

盡管當(dāng)前行業(yè)焦點(diǎn)集中于大模型能力,但其技術(shù)演進(jìn)方向仍存在變數(shù),例如VLA的局限性顯現(xiàn)后,行業(yè)開始重新審視世界模型的價值。

因此,宋繼強(qiáng)預(yù)測,未來一年內(nèi)出現(xiàn)統(tǒng)一的機(jī)器人專用芯片標(biāo)準(zhǔn)的可能性不大。無論是針對人形、輪臂式還是機(jī)器狗等不同形態(tài),都需要更明確的場景與規(guī)模支撐,專用芯片才會迎來發(fā)展的契機(jī)。

二、很多機(jī)器人仍處于“手搓”階段,量產(chǎn)須改進(jìn)成本、一致性、生產(chǎn)可靠性

宋繼強(qiáng)提到很多機(jī)器人并不是真正工業(yè)化量產(chǎn)的,大部分還是“手搓”。

一方面,零部件尚未達(dá)到車規(guī)或工業(yè)級要求,用一段時間后可能速度變壞、力量變差,最終達(dá)不到可信賴執(zhí)行。

另一方面,機(jī)器人產(chǎn)業(yè)要實(shí)現(xiàn)規(guī)?;占芭c成本優(yōu)化,可能依托大型企業(yè)來推動機(jī)器人零部件以及整體量產(chǎn)化能力的提高。

一旦量產(chǎn)能力突破,硬件成本將隨之下降,結(jié)合智能技術(shù)能力的持續(xù)提升,機(jī)器人將能更順利地滲透至更廣泛的商用場景,并吸引早期愿意為創(chuàng)新技術(shù)承擔(dān)一定試錯成本的用戶群體。

該發(fā)展路徑符合技術(shù)成熟度曲線(Gartner Hype Cycle)所揭示的規(guī)律:

① 初期通過高預(yù)期吸引資本與技術(shù)投入,例如當(dāng)前依托大模型與視覺語言動作模型(VLA)等技術(shù)突破,迅速推高產(chǎn)業(yè)的“能力上限”。

② 進(jìn)入部署實(shí)踐階段,暴露出的關(guān)鍵技術(shù)瓶頸與商業(yè)化挑戰(zhàn)(即“深坑”)將促使資源聚焦于最核心問題的解決。

③ 在跨越主要障礙后,產(chǎn)業(yè)將在特定細(xì)分領(lǐng)域(如結(jié)構(gòu)化的工業(yè)場景)實(shí)現(xiàn)小范圍的商業(yè)閉環(huán)與經(jīng)濟(jì)可行性驗(yàn)證。

④ 隨著技術(shù)迭代與市場認(rèn)知的深化,更多大型廠商將憑借其工業(yè)級能力入場,通過規(guī)模化效應(yīng)進(jìn)一步壓縮成本。

成本的降低又將激活更大的市場需求與應(yīng)用潛力,從而形成“技術(shù)突破->場景驗(yàn)證->規(guī)?;当?>市場擴(kuò)大”的良性循環(huán),推動產(chǎn)業(yè)持續(xù)向上發(fā)展。

目前帶操作能力的機(jī)器人,在現(xiàn)有訓(xùn)練集與成本約束下更可行的方向是應(yīng)用在半工業(yè)領(lǐng)域,比如做備料、搬運(yùn)、組裝等任務(wù)。有些廠商相對樂觀地估計,這些機(jī)器人一兩年內(nèi)能在實(shí)際工廠里部署。

在宋繼強(qiáng)看來,真正要形成工業(yè)級一致性與效率,具身智能機(jī)器人的產(chǎn)量可能需要百萬臺以上。要達(dá)到這個規(guī)模,則需不斷改進(jìn)成本、一致性、生產(chǎn)可靠性等方面。

三、構(gòu)建可信賴框架,給具身智能的安全兜底

具身智能機(jī)器人的真正落地涉及安全問題,需盡早形成可靠性的框架。

宋繼強(qiáng)總結(jié)說,具身智能的可信賴性至少體現(xiàn)在三個層級:規(guī)劃決策是否可信賴、執(zhí)行是否可信賴、系統(tǒng)出錯時整體是否仍可靠。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

針對規(guī)劃與決策是否可信賴,英特爾推薦混合模式控制:需要嵌入一定的規(guī)則與知識,用來檢驗(yàn)具身智能系統(tǒng)產(chǎn)生的決策,如果決策有問題就讓它重新決策。

這樣既能利用大語言模型與神經(jīng)網(wǎng)絡(luò)方法帶來的泛化能力,提高機(jī)器人能力的上限,又融合傳統(tǒng)的符號、規(guī)則、知識方法,能保證輸出是可信賴、可檢測的,再把結(jié)果交給執(zhí)行層。“場景相關(guān)”和“合理知識注入”也很重要,有助于做檢測與后續(xù)規(guī)則保障時更有效,控制整體計算開銷。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

對決策規(guī)劃、行動輸出做出保障,基本落在智能硬件平臺的系統(tǒng)里。但在執(zhí)行過程中,如果機(jī)器人遇到零部件或物理環(huán)境出問題,這些不是主控系統(tǒng)能控制的,此時需要引入一個獨(dú)立的安全系統(tǒng),持續(xù)監(jiān)控執(zhí)行是否偏離預(yù)期,一旦發(fā)現(xiàn)發(fā)現(xiàn)風(fēng)險,觸發(fā)Fallback,然后以最小風(fēng)險回到可控狀態(tài)。

這個安全系統(tǒng)相對輕量,代碼完全可靠,持續(xù)通過能獲取的傳感器輸入、執(zhí)行器狀態(tài)監(jiān)控等,判斷系統(tǒng)執(zhí)行是否與上層主要目標(biāo)一致、是否存在安全風(fēng)險。這些安全風(fēng)險可以預(yù)先定義并持續(xù)監(jiān)控。

Fallback System(備用系統(tǒng))既要讓系統(tǒng)回到可靠狀態(tài),又希望回到可靠狀態(tài)后不是直接放棄任務(wù),理想情況是即便出現(xiàn)風(fēng)險,也能以可行方式繼續(xù),比如讓機(jī)器人在即將摔倒時能夠選擇方向、避開人、卡死某些關(guān)節(jié)慢慢摔,甚至移動到邊上。

這套思路已經(jīng)被寫進(jìn)去年12月發(fā)布的《具身智能機(jī)器人安全子系統(tǒng)白皮書》。英特爾聯(lián)合產(chǎn)學(xué)界合作伙伴,從系統(tǒng)架構(gòu)層面提出一種新的設(shè)計框架,安全子系統(tǒng)能夠自主判斷主控系統(tǒng)是否出問題,一旦出問題就觸發(fā)Fallback。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

據(jù)宋繼強(qiáng)透露,該設(shè)計框架發(fā)布后反響很好,學(xué)術(shù)界和業(yè)界都有單位表示希望參與推進(jìn)落地,英特爾也在積極開展合作。

四、系統(tǒng)分工,才是具身智能能長期演進(jìn)的前提

在智能車、機(jī)器人等物理AI設(shè)備之上,一種流行的業(yè)務(wù)構(gòu)建方式是通過多智能體系統(tǒng),按照用戶要求、場景變化,自主構(gòu)成業(yè)務(wù)流,再利用AI生成相應(yīng)的智能體,去完成需求。

一種未來愿景是,一個能力豐富的物理設(shè)備能夠支撐多智能體系統(tǒng)運(yùn)行。要邁向這一愿景,現(xiàn)實(shí)挑戰(zhàn)有很多,包括準(zhǔn)確性、可靠性、安全性、可擴(kuò)展性、成本結(jié)構(gòu)、響應(yīng)速度、系統(tǒng)安全等。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

如果智能體是通過編排器自動構(gòu)建的,那就需要能夠調(diào)用很多不同的智能體功能。智能體在處理不同環(huán)節(jié)的任務(wù)時,內(nèi)核(kernel)、數(shù)據(jù)量級、并行度都不一樣。企業(yè)級部署又希望在滿足具體場景要求的同時,獲得更好的能效比。這需要借助異構(gòu)硬件組合來解決問題。

在此基礎(chǔ)上,要與持續(xù)演進(jìn)的開放軟件框架適配,中間需要完整的系統(tǒng)基礎(chǔ)設(shè)施,幫助隔離硬件多樣性,同時讓軟件側(cè)業(yè)務(wù)編程所付出的成本長期有效。因此上層需要相對穩(wěn)定的軟件接口,并對底層硬件進(jìn)行隔離。

具身智能機(jī)器人采用的AI模型及解決方案呈多元化,沒有一種方案能覆蓋所有精度與準(zhǔn)確度要求。因此,英特爾提倡采用一種混合的異構(gòu)框架,以綜合采用不同模型與AI方法。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

英特爾提出了一種分工明確的具身智能系統(tǒng)結(jié)構(gòu):

系統(tǒng)2是慢系統(tǒng),強(qiáng)調(diào)理解、推理與規(guī)劃,需要高通量視覺輸入,更適合用GPU。

系統(tǒng)1是行動專家,負(fù)責(zé)根據(jù)規(guī)劃出的一段段任務(wù),結(jié)合具體設(shè)備,將任務(wù)映射到設(shè)備需要控制的關(guān)節(jié)電機(jī)、輪子等多自由度執(zhí)行器,生成控制指令。這要求高實(shí)時性與低功耗,輸出頻率已接近200Hz,更適合用NPU。

系統(tǒng)0是快系統(tǒng),用傳統(tǒng)的MPC控制器,把電機(jī)控制頻率提升到例如1000Hz的級別。這要求更強(qiáng)實(shí)時性,并涉及高精度浮點(diǎn)運(yùn)算,用CPU最穩(wěn)。

具身智能機(jī)器人需要什么樣的芯片?對話英特爾中國研究院院長宋繼強(qiáng)

在切換新硬件時,軟硬件解耦有助于降低適配門檻。據(jù)宋繼強(qiáng)分享,系統(tǒng)2相對好解耦,系統(tǒng)0和系統(tǒng)1不好解耦。上層感知和規(guī)劃可以相對獨(dú)立,復(fù)用于不同機(jī)器人,但從接收到規(guī)劃任務(wù)要求到生成具體機(jī)器人控制指令,不同機(jī)器人的自由度不同,與本體強(qiáng)相關(guān),這就無法解耦。

結(jié)語:具身智能走向落地分水嶺

2026年,落地將是具身智能機(jī)器人產(chǎn)業(yè)的關(guān)鍵議題,供應(yīng)鏈也將扮演至為關(guān)鍵的角色。

模型決定機(jī)器人能做什么,而硬件和系統(tǒng)決定機(jī)器人能不能一直穩(wěn)定安全地做下去。

基于英特爾的理念以及與合作伙伴正在構(gòu)建的具身智能機(jī)器人系統(tǒng),結(jié)合第三代酷睿Ultra for Edge平臺,英特爾希望盡快推動可信賴的具身智能機(jī)器人在產(chǎn)業(yè)里落地。