機器人前瞻(公眾號:robot_pro)
作者?|??許麗思
編輯?|??漠影

機器人前瞻11月3日報道,今天,智元機器人宣布其研發(fā)的真機強化學習技術,已在與龍旗科技合作的驗證產(chǎn)線中成功落地。真機強化學習技術首次從學術論文走向工業(yè)應用,也為消費電子等精密制造領域帶來 “即插即用” 的智能升級方案。

長期以來,精密制造產(chǎn)線面臨剛性瓶頸:傳統(tǒng)機械臂依賴復雜夾具設計與場地改造,調試周期長、換型成本高;“視覺 + 力控”等柔性方案雖有改進,卻存在參數(shù)敏感、部署復雜等問題,難以適配消費電子行業(yè)高頻產(chǎn)品迭代需求。

智元此次落地的真機強化學習方案,讓機器人可在真實產(chǎn)線中自主學習、持續(xù)優(yōu)化作業(yè)策略,新技能訓練與穩(wěn)定部署僅需數(shù)十分鐘,且性能全程不降級。

智元機器人合伙人兼首席科學家羅劍嵐解釋,這樣的效率,是通過預訓練模型,結合少量示范和糾錯,快速點亮策略,并在工業(yè)給定范圍內微調參數(shù)來達成。即便是復雜場景遷移,比如相近但不完全相同的工序,通過持續(xù)學習與自校準也僅需十幾到三十分鐘。

該技術目前已在龍旗 FCT 精密產(chǎn)線(iPad 電檢場景)實現(xiàn)落地,作業(yè)精度達到毫米級別,80%的應用集中在上下料這類傳統(tǒng)自動化難以完成、需要柔性換線的任務。

智元真機強化學習落地產(chǎn)線!僅需十分鐘,機器人快速完成訓練部署

相較傳統(tǒng)方案,該技術展現(xiàn)三大核心優(yōu)勢:

極速部署:訓練周期從 “數(shù)周”銳減至 “數(shù)十分鐘”,效率實現(xiàn)指數(shù)級提升;

超高適配:自主克服來料位置偏差、尺寸公差等擾動,在長周期運行中持續(xù)保持工業(yè)級穩(wěn)定性與100%任務完成率;

柔性換型:任務變更僅需快速再訓練,無需定制夾具或復雜工裝,即可適配不同產(chǎn)品與工序,破解消費電子行業(yè)長期存在的“產(chǎn)線剛性與產(chǎn)能波動”難題。

由此,真機強化學習方案在占用空間、硬件依賴與環(huán)境適配方面展現(xiàn)出高度通用性,可在不同工位和產(chǎn)品線上快速遷移與復用。

這一成果意味著具身智能機器人的感知決策層與運動控制層實現(xiàn)了高效協(xié)同,標志著具身智能機器人在“算法智能”與“執(zhí)行智能”的一體化融合上邁出了關鍵一步。更重要的是,它并非實驗室中的概念演示,而是在準生產(chǎn)條件下的真實部署。

據(jù)了解,智元機器人僅用一年時間便實現(xiàn)了強化學習在工業(yè)場景中的系統(tǒng)化落地。這一成果不僅驗證了強化學習在復雜真實環(huán)境中的可靠性與可復用性,也標志著具身智能從學術探索階段邁入規(guī)?;I(yè)應用的新階段。

接下來,智元機器人與龍旗科技將基于本次成果持續(xù)推進技術迭代,推動真機強化學習在消費電子、汽車電子等更多精密制造場景的應用與復制,加速構建具身智能驅動的 AI 制造生態(tài),助力工業(yè)智能化的普及化與標準化進程。