機器人前瞻(公眾號:robot_pro)
作者?|??許麗思
編輯?|??漠影

一家成立不到半年的具身智能創(chuàng)企,在產(chǎn)品正式對外發(fā)布前就默默攢了個神仙局,吸引了智元機器人、沐曦股份、中科曙光、本末科技、鹿明機器人、RoboScience、RoboParty等涵蓋機器人產(chǎn)業(yè)鏈多個環(huán)節(jié)的頭部玩家,齊齊為其背書打call。它到底是什么來頭?

這家公司就是大曉機器人。這場行業(yè)聚首,也傳遞出一個鮮明信號:在通往通用機器人的漫長道路上,中國機器人企業(yè)不是單打獨斗,而是選擇“在一起”。

回看過去一年,部分具身企業(yè)在融資、產(chǎn)品、訂單上一路狂飆,有時候會讓外界形成“具身智能第一梯隊已定、頭部格局已完成”的直觀判斷。但具身智能的牌桌,真坐滿了嗎?

大曉機器人董事長王曉剛的回答很直接:頭部卡位還沒有完成,這個領(lǐng)域還遠(yuǎn)未成熟。在他看來,首先,機器人原有的技術(shù)路線仍有明顯缺陷,視覺為主的方案并非終局;其次,規(guī)?;瘓鼍?/b>尚未跑通,現(xiàn)在的機器人要么是提供情緒價值的表演性質(zhì)產(chǎn)品,要么是作為科研平臺存在;最后,產(chǎn)業(yè)鏈分工與成本控制、可靠性仍處早期,從零部件、傳感器到計算芯片等環(huán)節(jié),都存在很大的垂直整合空間。

具身智能的不確定性中蘊含著巨大的機會,一旦研究范式與技術(shù)路線發(fā)生重大轉(zhuǎn)變,前期積累可能會被快速顛覆,產(chǎn)業(yè)格局也將被重新洗牌。

大曉機器人選擇在這個時候入局,正是因為看到了一個全新的研究范式,即以人為中心的ACE研究范式。

12月18日,大曉機器人發(fā)布多款重磅新品:首個開源且商業(yè)應(yīng)用的開悟世界模型3.0(Kairos 3.0),開發(fā)者只需輸入簡單指令,就能快速生成可視化的任務(wù)模擬內(nèi)容;具身超級大腦模組A1,讓機器狗能自主識別紅綠燈過馬路,能幫人看護(hù)孩童、提醒路人不要亂丟垃圾,甚至還能識別違停車輛、記錄車牌。

一、港中文同門室友攜手,入場自帶深厚技術(shù)和落地經(jīng)驗

大曉機器人并非白手起家的公司,更像是一次帶著資源入場的再創(chuàng)業(yè)。其核心團(tuán)隊,不僅有著十余年技術(shù)積累,也有產(chǎn)業(yè)級客戶與渠道資源的沉淀。

王曉剛作為商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事,曾負(fù)責(zé)過手機、互聯(lián)網(wǎng)、汽車等多條業(yè)務(wù)線,對商湯的研發(fā)體系非常熟悉,能夠很好地推動商湯與大曉機器人的業(yè)務(wù)形成聯(lián)動,將商湯在渠道、客戶、垂直應(yīng)用開發(fā)等方面的優(yōu)勢遷移到大曉機器人上,幫助其快速實現(xiàn)場景的規(guī)?;涞?。

目前,他主要負(fù)責(zé)大曉機器人整體戰(zhàn)略規(guī)劃與商業(yè)落地,同時推動優(yōu)秀研究成果的產(chǎn)業(yè)化、工程化轉(zhuǎn)化。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

▲商湯科技聯(lián)合創(chuàng)始人、執(zhí)行董事、大曉機器人董事長王曉剛

大曉機器人首席科學(xué)家陶大程兼具頂尖學(xué)術(shù)造詣與深厚產(chǎn)業(yè)實踐積淀。作為澳大利亞科學(xué)院院士,他榮獲IEEE計算機學(xué)會技術(shù)成就獎;同時,他曾出任京東探索研究院創(chuàng)始院長、優(yōu)必選人工智能首席科學(xué)家,深度參與科技企業(yè)的技術(shù)戰(zhàn)略布局與產(chǎn)品落地實踐。他在大曉承擔(dān)“持續(xù)研究創(chuàng)新”的牽引角色,主要負(fù)責(zé)帶領(lǐng)教授團(tuán)隊聚焦具身智能方向的創(chuàng)新。

而王曉剛和陶大程憑借深厚的AI學(xué)術(shù)積累,被評為全球華人科學(xué)家TOP5。此外,大曉機器人還匯集了多位來自南洋理工大學(xué)、香港大學(xué)和香港中文大學(xué)的AI科學(xué)家——呂健勤、李鴻升、劉子緯、潘新鋼、趙恒爽、劉?;?,他們既是環(huán)境智能、世界模型、具身基礎(chǔ)模型等垂直領(lǐng)域的開拓者,也是全球頂尖AI實驗室MMLab的核心成員。其中多位核心成員是陶大程、王曉剛的學(xué)生,團(tuán)隊合作默契。

“互信”是大曉機器人創(chuàng)始團(tuán)隊的底色:首席科學(xué)家陶大程與董事長王曉剛在香港中文大學(xué)求學(xué)期間,都師從湯曉鷗,其他教授都與MMLab有著深厚淵源,建立了深厚的互信基礎(chǔ)。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=▲從左往右:潘新鋼、李鴻升、陶大程、王曉鋼、呂健勤、劉子緯、趙恒爽

更重要的是,大曉的團(tuán)隊是“教授團(tuán)隊+產(chǎn)業(yè)專家”的組合邏輯,匯集了來自AI、互聯(lián)網(wǎng)、機器人、智能駕駛等領(lǐng)域、擁有十余年行業(yè)實戰(zhàn)經(jīng)驗的頂尖產(chǎn)業(yè)專家,親歷過從技術(shù)原型到規(guī)?;逃玫娜溌愤^程,能夠推動具身智能從技術(shù)前沿到產(chǎn)業(yè)落地。

二、從“以機器人為中心”到“以人為中心”,最早提出環(huán)境式采集

在王曉剛看來,傳統(tǒng)具身智能發(fā)展存在短板,是因為它所采用的是“以機器為中心”的路線。該路線先設(shè)計形態(tài)、參數(shù)差異巨大的各類機器人本體,再通過本體采集數(shù)據(jù)訓(xùn)練通用模型,本質(zhì)上是用極高的資源消耗,換取有限且僵化的“智能”。

因此,大曉機器人率先提出“以人為中心(Human-centric)”的ACE具身研發(fā)范式將人類與物理世界的互動規(guī)律作為核心研究起點,構(gòu)建了一套從“環(huán)境式數(shù)據(jù)采集—開悟世界模型3.0—具身交互”的全鏈路技術(shù)體系。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

ACE范式核心技術(shù)之一,就是環(huán)境式數(shù)據(jù)采集技術(shù)。

今年8月前后,特斯拉、Figure AI等頭部企業(yè),都從真機遙操轉(zhuǎn)向以視覺為基礎(chǔ)的數(shù)據(jù)采集技術(shù)路線,但并未涵蓋力、觸覺、摩擦力等關(guān)鍵維度。世界模型是圍繞人與所接觸的世界、所處的環(huán)境展開,要對此進(jìn)行建模,就涉及視覺之外的更多維度。

所以,大曉機器人的環(huán)境式采集,并非單純局限于視覺模態(tài),而是整合第一視角與第三視角視頻、力觸覺信息、運動軌跡、語音等多模態(tài)數(shù)據(jù)構(gòu)建基于物理基礎(chǔ)的3D資產(chǎn)庫,覆蓋具身模型訓(xùn)練所需的各類交互信息。

在數(shù)據(jù)處理環(huán)節(jié),通過時序一致性對齊、交互動態(tài)軌跡預(yù)測建模與物理正確性仿真校正,將采集到的“人—物—場”信息轉(zhuǎn)化為可直接用于模型訓(xùn)練的動態(tài)場景數(shù)據(jù),實現(xiàn)從數(shù)據(jù)采集到應(yīng)用的全鏈路打通。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

這種技術(shù)路徑,不僅數(shù)據(jù)維度更全面、任務(wù)覆蓋更長程,而且交互精度更高,采集效率更具規(guī)?;?,能快速完成從十萬小時到千萬小時的海量數(shù)據(jù)積累。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

該技術(shù)已在實踐中進(jìn)行驗證:在即時零售倉儲場景中,其已實現(xiàn)多視角數(shù)據(jù)采集,覆蓋數(shù)萬種 SKU,完成倉儲分揀與打包全流程,涵蓋五大階段13個原子動作;在居家、零售等多元場景中,也已實現(xiàn)對人體自然行為、物品交互軌跡的精準(zhǔn)捕捉,甚至能復(fù)現(xiàn)遙操作范式下難以實現(xiàn)的生鮮抓取、精細(xì)化放置等任務(wù)。

三、推出開源世界模型,開啟物理世界的“DeepSeek時刻”

想要在具身智能的牌桌上改寫格局,大曉機器人最堅實的底氣在于軟件、硬件上的產(chǎn)品力。

以環(huán)境式采集數(shù)據(jù)為基礎(chǔ),大曉機器人發(fā)布了首個開源且商業(yè)化應(yīng)用的世界模型——“開悟”世界模型(Kairos 3.0),內(nèi)置11大類、54細(xì)類,累計328個標(biāo)簽,覆蓋115個垂類具身場景,開發(fā)者只需輸入簡單指令,就能快速生成可視化的任務(wù)模擬內(nèi)容,并可一鍵分享。

“開悟”采用“多模態(tài)理解-生成-預(yù)測”的一體化架構(gòu):

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

多模態(tài)理解:通過視覺、3D 軌跡、觸覺、摩擦力等多維度信息輸入,深度理解真實世界的物理規(guī)律與人類行為的底層邏輯。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=生成:基于多模態(tài)信息的深度融合,模型可生成長時動態(tài)交互場景視頻,在場景內(nèi)實現(xiàn)各元素精準(zhǔn)可控;并具備跨本體一鍵生成、多本體泛化、預(yù)測萬千演化路徑等特性,為具身智能提供高保真、可泛化的虛擬訓(xùn)練環(huán)境。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=
預(yù)測:根據(jù)所選機器人本體、觀察到的圖像及視頻狀態(tài),可預(yù)測機器人后續(xù)動作。

大曉機器人也高度重視開源模型社區(qū)的建設(shè),把世界模型變成行業(yè)可調(diào)用的基礎(chǔ)設(shè)施。其已向全行業(yè)開放API,讓所有企業(yè)都可以使用“開悟”世界模型工具鏈,推動各類具身智能產(chǎn)品快速涌現(xiàn)。

另外,“開悟”已與沐曦股份、壁仞科技、中科曙光等多款廠商國產(chǎn)芯片完成適配,極大提升了芯片性能。

就像DeepSeek的出現(xiàn)改寫了大模型應(yīng)用生態(tài)的格局,“開悟”的出現(xiàn),有望開啟物理世界的“DeepSeek時刻”,構(gòu)建國產(chǎn)芯片與空間智能的新生態(tài)。

四、給機器人造超級大腦,快速部署安防、交通、文旅等場景

大曉機器人發(fā)布了具身超級大腦模組A1,搭載首創(chuàng)純視覺無圖端到端VLA具身智能模型,提升了機器狗復(fù)雜陌生環(huán)境中的適應(yīng)能力、交互能力等,能夠在多個場景下快速部署。

A1具備云端交互能力,依托云端模型平臺,能實時解析自然語言指令與圖像語義的意圖關(guān)系,讓機器狗先理解要做什么,再生成可執(zhí)行的中間指令,最后交由底層控制器執(zhí)行。這樣,機器狗不僅能在復(fù)雜環(huán)境中自主巡檢、跟隨、避障,還能按自然語言指令更準(zhǔn)確地完成任務(wù)。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

具體來說,A1讓機器狗無需預(yù)采高精地圖,就可以自主規(guī)劃導(dǎo)航路徑,自如穿梭在城市街道、天橋、臺階、人來人往的小區(qū)路口等多種復(fù)雜真實環(huán)境。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

在這個過程中,機器狗能夠自主識別紅綠燈,明白什么時候過馬路;也能準(zhǔn)確識別前方障礙物,精準(zhǔn)避開。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

在發(fā)現(xiàn)有人隨地丟棄垃圾時,機器狗會主動提醒“公共場合,請不要亂丟垃圾”;發(fā)現(xiàn)兒童靠近水池區(qū)域時,會提醒“水池危險,請勿靠近”;同時還能識別違停車輛,記錄車牌并上傳云端,展現(xiàn)出多場景適配的綜合能力。

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

具身智能格局已定?商湯背景具身創(chuàng)企入局,全球華人TOP5科學(xué)家?guī)ш? width=

基于以上優(yōu)勢,具身超級大腦模組A1在安防、能源、交通、文旅等對設(shè)備可靠性要求極高的場景中,可實現(xiàn)長期穩(wěn)定工作。

王曉剛透露,大曉機器人在世界模型、具身大模型及數(shù)據(jù)服務(wù)領(lǐng)域已獲得部分訂單;未來重點推出的軟硬一體產(chǎn)品,預(yù)計明年能實現(xiàn)大規(guī)模落地。打造能針對性解決各種實際問題的軟硬一體的產(chǎn)品,是大曉的終極目標(biāo)。

發(fā)布會現(xiàn)場,大曉機器人還宣布與智元機器人、銀河通用、沐曦、壁仞科技、中科曙光、Insta360、臥龍電驅(qū)等具身廠商、硬件、芯片、云服務(wù)、數(shù)據(jù)廠商等多領(lǐng)域伙伴達(dá)成戰(zhàn)略合作,共建“模型—硬件—場景”的一體化生態(tài),來縮短技術(shù)轉(zhuǎn)化鏈路。

結(jié)語:具身智能終局,在于構(gòu)建可持續(xù)進(jìn)化的機器智能

具身智能的競爭,從來不是單點技術(shù)的比拼,而是生態(tài)與落地能力的系統(tǒng)較量。

當(dāng)行業(yè)從實驗室走進(jìn)現(xiàn)實,誰能真正突破機器人與物理世界的交互天花板、破解規(guī)?;涞氐某杀九c可靠性瓶頸、構(gòu)建可持續(xù)進(jìn)化的機器智能,誰才能在具身智能的激烈競爭中站穩(wěn)腳跟。

大曉機器人從“以人為中心”的技術(shù)路徑切入,攜手產(chǎn)業(yè)鏈伙伴共建技術(shù)到場景的全鏈條,正是在嘗試回答這個問題,也或?qū)⒊蔀橥苿有袠I(yè)范式遷移的關(guān)鍵變量。