馬年春晚舞台上,機器人輪番上台演小品、秀武術、拍電影,完成了一場國產人形機器人的國民級亮相,也引發大量追問:機器人何時走進日常生活?今年初啟動試運營的廣東省首個異構具身智能機器人訓練場——惠陽異構具身智能訓練場,或許可以解答一二。
訓練場位於惠州市惠陽區科技創新中心。推門而入,幾十台形態各異的機器人正在給超市貨架擺放商品、收銀掃描,在「快遞站」分揀包裹,製作咖啡,分類生物醫藥物料……充滿科幻感的「未來」觸手可及。細看之下,每台機器人背後都有一位人類訓練師在仔細操控。這其實是機器人正在接受不同場景的「職業培訓」,過程中產生的海量行為數據,正是讓通用機器人順利走入千家萬戶的「秘笈」。
●文/圖:香港文匯報記者 李紫妍 廣東報道
與實驗室裏簡單、有限、可復現的場景不同,一旦走入真實世界,機器人將面對無窮無盡的複雜狀況。要「智能地」應對一切,還需更多來自物理世界的真實行為數據。具身智能機器人訓練場通過搭建真實物理場景與仿真平台,供機器人「學習」人類行為,採集有效訓練數據,推動具身智能數據標準化,破解高質量訓練數據短缺這一發展瓶頸。
「機器人要有強泛化能力」
「機器人一定要有更強的泛化能力,要能舉一反三,達到一定程度後才會出現『湧現』的能力,遇到沒見過的東西也能自主應對。」惠陽異構具身智能訓練場運營方刻行時空創始人兼CEO黃陽明介紹,目前訓練場共劃分16類大場景,涵蓋康養家庭、酒店客房、工業流水線分揀、生物醫藥物料分類等,場景維持高頻迭代,平均每兩周更新一次。上月末,訓練場正式產出的首批「數字資產」已陸續交付。
場景均採企業工廠真實環境
訓練場中的場景均採用當地企業、工廠的真實環境。機器人在訓練師操控下,一遍遍重複人類的精準動作,學習應對不同規格、材質、形狀物體時的發力方式與運動軌跡等信息,並生成相應數據。數據經過標註、清洗等技術處理後,留下有價值的高質量數據。基於對這些數據的學習,機器人逐漸形成自己的「手感」,越發靈活地應對現實場景。「必須有足夠多的數據去教會它,這個過程和我7個月大的小孩學習拿東西很像。」黃陽明說。
製造業基礎優勢助數據生產
目前,優必選、星塵智能、智元、穹徹智能、浙江人形等國內頭部機器人企業的約180台機器人已在此「入學」,包括雙足機器人、輪式人形機器人、固定式機械臂等不同構型,預計一年可採集500萬條多模態數據,並將持續引入更多本體廠商。黃陽明介紹,除場景多元豐富外,不同機器人產生的異構數據同樣是增加數據多樣性、提高泛化能力的重要維度。
國家「十五五」規劃綱要重點布局具身智能等未來產業,構建全鏈條培育體系,提出強化算力算法數據高效供給,促進模型算法迭代創新,鼓勵具身智能技術創新,探索通用人工智能發展路徑。
在此背景下,「數據」正成為新的「石油」「黃金」,和未來國際競爭的關鍵資源。「這類數據的需求是全球化的,中國如果能率先掌握高質量的數據標準,就擁有了話語權。」黃陽明說,中國的競爭優勢在於製造業基礎,大量的場景和技術工人有助於數據生產,快速填補空白。
自去年起,內地具身智能訓練場的建設熱潮全面爆發,北京、廣州、上海、天津、綿陽等多個城市已陸續建成專業訓練場。中國人工智能學會副理事長、清華大學教授孫富春對此表示,建設訓練場能推動具身智能數據標準化,將仿真數據與真實數據結合,破解高質量訓練數據缺乏的難題。
面臨重複採集難共享等挑戰
同時孫富春指出,當前具身智能訓練場面臨兩方面挑戰:一是對具身智能人形機器人的定義與內涵仍存在諸多不一致;二是現有數據採集途徑容易造成重複採集,採集的數據難以使用和共享,缺乏統一評價標準與安全可靠的保障。
黃陽明指出,作為惠陽異構具身智能訓練場的運營方,刻行時空主要解決異構機器人接入標準不統一、場景數據價值挖掘不足,以及不同模型廠商數據需求匹配與共享效率不高等問題。他認為,未來具身智能產業競爭很大程度上將體現為高質量數據能力的競爭,能夠持續生產、組織和流通數據的平台,將成為產業發展的重要基礎設施,在這一點上,粵港澳大灣區正走在前列。

評論(0)
0 / 255