機器人前瞻(公眾號:robot_pro)
作者?|??許麗思
編輯?|??漠影

機器人前瞻7月27日報道,這兩天,2025世界人工智能大會(2025WAIC)正在上海如火如荼地舉行。走進展館,一股充滿賽博感的機器人浪潮撲面而來,現(xiàn)場設(shè)置了別具特色的「WAIC里 技能大舞臺」:人形機器人點亮各項技能點,在文藝站、修理鋪、小吃街等場景中熱火朝天炫技,完成打鼓、舞龍、書法、煮串、剝蛋、調(diào)飲品、做美食、搞維修等精細化操作。

人形機器人現(xiàn)場提筆研墨,用毛筆寫下“?!弊?,身后還有幾個機器人一邊打鼓、一邊舞龍助威。

WAIC 機器人太會玩了!寫書法、舞龍、做小吃,背后藏著這朵云

有的機器人現(xiàn)場當起維修工,有的則可以打造一場沉浸式流水線生產(chǎn)體驗。

WAIC 機器人太會玩了!寫書法、舞龍、做小吃,背后藏著這朵云 WAIC 機器人太會玩了!寫書法、舞龍、做小吃,背后藏著這朵云

機器人打起麻將來,也是有模有樣。

WAIC 機器人太會玩了!寫書法、舞龍、做小吃,背后藏著這朵云

臺前這些機器人的炫酷技能展示,背后不少有百度智能云的身影。在2025WAIC上,百度智能云AI基礎(chǔ)設(shè)施入選了大會重點創(chuàng)新成果,將以算力、平臺到應(yīng)用的系統(tǒng)級能力,推動更多具身智能企業(yè)產(chǎn)品應(yīng)用的深度落地與創(chuàng)新突破。

百度副總裁袁佛玉在大會現(xiàn)場發(fā)表演講,一語點破了百度智能云的具身智能布局邏輯:要先做好兩大角色,技術(shù)賦能者與場景鏈接者。

憑借著長期以來在數(shù)據(jù)采集、大模型、場景等方面的深厚沉淀,百度智能云先從機器人底層技術(shù)架構(gòu)入手,幫助企業(yè)解決在數(shù)據(jù)、訓練、推理等方面的挑戰(zhàn),又加速打通了機器人從實驗室到場景應(yīng)用的最后一公里。這使其不僅成為大多數(shù)主流具身智能企業(yè)落地大模型的選擇,更成為產(chǎn)業(yè)發(fā)展的加速器。

一、破解具身智能數(shù)據(jù)瓶頸,全面加速具身模型開發(fā)

人形機器人在WAIC大會完成各種高難度動作的背后,離不開來自真實世界的數(shù)據(jù)集支撐。但當前具身智能產(chǎn)業(yè)正卡在數(shù)據(jù)稀缺的節(jié)點上:一是機器人所需要的真實世界數(shù)據(jù)還沒能形成足夠的規(guī)模,二是行業(yè)未形成統(tǒng)一規(guī)模的數(shù)據(jù)采集、標注規(guī)范,大量真實世界的原始數(shù)據(jù)無法直接用于模型訓練,數(shù)據(jù)集質(zhì)量參差不齊。

而百度智能云的破局思路,是把老經(jīng)驗用在了新賽道上。在自動駕駛、互聯(lián)網(wǎng)等領(lǐng)域,百度智能云沉淀了多年的專業(yè)化、規(guī)?;瘮?shù)據(jù)采集與標注能力以及相關(guān)配套的數(shù)據(jù)一體化平臺軟件,恰好能夠?qū)⑦@些經(jīng)驗與能力復(fù)用到具身智能領(lǐng)域。

百度智能云所打造的具身智能數(shù)據(jù)采集標注方案,支持文本、語音、圖像、人像、道路等多模態(tài)數(shù)據(jù)采集,具備數(shù)據(jù)清洗及分類、2D/3D障礙物標注、BEV感知數(shù)據(jù)等標注能力,涵蓋人形具身智能產(chǎn)品、機械臂等多本體類型,支持遙操作和慣導(dǎo)動捕。目前,百度智能云在具身數(shù)據(jù)采標服務(wù)商,已成為國內(nèi)市場份額第一的云廠商。

北京人形機器人創(chuàng)新中心、傅利葉機器人、人形機器人(上海)有限公司等都采用了百度智能云的數(shù)據(jù)采集標注方案,今年上半年,天工機器人勇奪全球首航人形機器人半程馬拉松冠軍,也離不開百度智能云所打造的這套數(shù)據(jù)方案。

值得一提的是,百度智能云還攜手北京人形機器人創(chuàng)新中心建設(shè)百萬量級的高密度、高質(zhì)量、高通用性數(shù)據(jù)集,打造世界最大的具身智能機器人數(shù)據(jù)采集和訓練基地,進一步解決行業(yè)真機數(shù)據(jù)稀缺的問題,尤其是機器人操作能力方面。

WAIC 機器人太會玩了!寫書法、舞龍、做小吃,背后藏著這朵云

參會的人形機器人們大炫在各種場景中的復(fù)雜操作,這是一個復(fù)雜的大腦、小腦協(xié)同執(zhí)行任務(wù)的過程,不僅在底層AI算力上面臨挑戰(zhàn),還涉及了感知、理解、決策、控制等多方面能力的綜合運用。

袁佛玉介紹,百度智能云正全力支撐多家企業(yè)的具身模型研究工作,不止提供云上算力,還針對具身VLA模型、多模態(tài)VLM、世界模型等做了大量訓練和推理加速工程優(yōu)化工作。

具體來說,百度智能云是云廠商中第一家在GPU算力平臺上全面適配三個主流開源VLA(RDT、π0和GR00T N1.5)的廠商,助力企業(yè)算法工程師快速開啟VLA技術(shù)路線探索。

在具身大腦能力構(gòu)建上,百舸AI異構(gòu)計算平臺能夠讓企業(yè)在探索世界模型時,訓練性能上高于社區(qū)版本20%以上,推理性能高于社區(qū)版本30%以上,且還在持續(xù)優(yōu)化中。在典型的多模態(tài)VLM上,百舸訓練和推理均相比社區(qū)版本提升10%以上。

針對具身大模型開發(fā)的差異化特點,百度智能云還著力于優(yōu)化長序列性能和多模態(tài)訓練架構(gòu),與賽道企業(yè)一起共創(chuàng)面向具身操作大模型、世界模型的更優(yōu)AI基礎(chǔ)設(shè)施(AI Infra)能力。

二、無需追求“六邊形戰(zhàn)士”,場景應(yīng)用加速機器人迭代進化

在WAIC現(xiàn)場,可以看到很多機器人在工廠、快遞站、小吃攤、咖啡店等各種各樣的場景中執(zhí)行操作任務(wù)。這也確實是近來各大廠商的重心所在:加速推進機器人在產(chǎn)業(yè)上落地,講述機器人進入工業(yè)生產(chǎn)線、商業(yè)服務(wù)場景的故事。

“在具身智能機器人產(chǎn)品的場景化應(yīng)用落地上,行業(yè)認識到,大家無需追求一個六邊形戰(zhàn)士產(chǎn)品,才推向場景落地?!痹鹩裾f。

機器人不用等到能做好所有事才出發(fā),能先進入真實場景中做好一部分事情,反哺技術(shù)迭代進化,再從適應(yīng)單一場景走向適配多類場景。這樣的小嘗試即便不夠完美,但終將能成為機器人未來掌握通用能力的基石。

WAIC 機器人太會玩了!寫書法、舞龍、做小吃,背后藏著這朵云

所以比起追求“六邊形戰(zhàn)士”式的全能產(chǎn)品,目前更重要的是要找到技術(shù)能力與場景的匹配點。針對具身智能行業(yè),百度智能云憑借著多年在TO B端的深耕,積累了教科研、康養(yǎng)、制造、物流、能源、商業(yè)、生命科學等各行業(yè)場景方企業(yè)。

比如,在教科研行業(yè),百度智能云覆蓋全國500多所高職高專院校,在AI人才培養(yǎng)課程、AI賽事等方面建立了廣泛合作;在能源行業(yè),其與電網(wǎng)、石油石化等企業(yè),在輸電通道、變電站、油氣場站等業(yè)務(wù)巡檢中已廣泛合作;在商業(yè)服務(wù)行業(yè),其與瑞幸、海底撈等大型連鎖企業(yè)開展業(yè)務(wù)數(shù)智化升級合作。

之前,百度智能云還與智元機器人達成戰(zhàn)略合作,聚焦科研教育場景,打造教科研與產(chǎn)業(yè)落地的機器人開發(fā)平臺,后續(xù)將建設(shè)覆蓋工業(yè)、農(nóng)業(yè)等更多行業(yè)的聯(lián)合生態(tài)解決方案,實現(xiàn)雙方技術(shù)鏈路和商業(yè)優(yōu)勢的有效結(jié)合。

這些場景嘗試的共同邏輯,都是讓機器人在現(xiàn)實世界里摸爬滾打,邊干活邊學習。袁佛玉提到,百度智能云會與更多具身智能企業(yè)攜手,以“具身智能機器人+行業(yè)”的解決方案模式,在各行業(yè)場景中推廣落地。助推具身智能機器人這一新興科技產(chǎn)品,跨越鴻溝。

三、結(jié)語:從技術(shù)落地到生態(tài)共建,百度智能云的具身智能長期主義

人形機器人被認為是有望連接起線下實體與線上世界的重要基礎(chǔ)設(shè)施。7月以來,人形機器人行業(yè)延續(xù)了上半年融資熱潮,還在融資節(jié)奏和資金體量上全面提檔,幾乎可以說是“一天一輪”,各路大廠、國資都在加快布局這一賽道。

在這場關(guān)乎未來的技術(shù)競速中,百度智能云圍繞具身大腦、運控小腦、具身數(shù)據(jù)集建設(shè)、整機本體研發(fā)四大領(lǐng)域,助力企業(yè)具身智能關(guān)鍵技術(shù)及產(chǎn)品研發(fā),高效推動機器人從實驗室邁向現(xiàn)實世界。當技術(shù)迭代進化、場景不斷拓展,產(chǎn)業(yè)生態(tài)愈發(fā)成熟,具身智能邁向人機共生新紀元的腳步,正被穩(wěn)穩(wěn)推向更遠的未來。