在具身智能技術加速向工廠、家庭和醫(yī)療場景滲透的背景下,數(shù)據(jù)供給不足已成為制約行業(yè)規(guī)模化落地的核心難題。京東集團近日宣布推出覆蓋全鏈路的數(shù)據(jù)基礎設施解決方案,通過構建全球最大規(guī)模的具身數(shù)據(jù)采集體系,為行業(yè)提供從數(shù)據(jù)生成到模型優(yōu)化的閉環(huán)支撐。據(jù)技術團隊披露,該計劃將發(fā)動60萬人參與數(shù)據(jù)采集,目標在兩年內積累1000萬小時真實場景視頻數(shù)據(jù),重點解決機器人訓練數(shù)據(jù)匱乏的痛點。
京東云自主研發(fā)的可穿戴式超高清采集設備JoyEgoCam成為數(shù)據(jù)采集環(huán)節(jié)的關鍵突破。這款設備通過優(yōu)化光學模組與傳輸協(xié)議,在物流分揀、手術操作、家庭服務等動態(tài)場景中實現(xiàn)4K級視頻的穩(wěn)定采集。技術負責人介紹,設備內置的AI校準系統(tǒng)可自動修正運動模糊,確保每個動作片段的時空連續(xù)性,為后續(xù)數(shù)據(jù)標注提供可靠基礎。
在數(shù)據(jù)處理層面,京東構建的AI數(shù)據(jù)湖平臺展現(xiàn)出強大的吞吐能力。該平臺采用分布式計算架構,可每秒處理數(shù)萬幀視頻數(shù)據(jù),通過自動化的清洗、對齊和預標注流程,將原始數(shù)據(jù)的利用率提升80%。更值得關注的是JoyBuilder仿真平臺,其通過物理引擎重構真實場景,能將1小時人類操作數(shù)據(jù)擴展為10小時仿真訓練素材,有效緩解真實數(shù)據(jù)采集成本高昂的難題。
行業(yè)調研顯示,當前具身智能模型訓練面臨嚴重的數(shù)據(jù)鴻溝。京東技術委員會主席曹鵬指出,要訓練出具備跨場景適應能力的通用模型,至少需要千萬小時級的真實交互數(shù)據(jù),而現(xiàn)有公開數(shù)據(jù)集規(guī)模不足需求的百分之一。"許多機器人演示時能跳舞翻跟頭,但進入生產(chǎn)線連零件都抓不穩(wěn),這就是數(shù)據(jù)泛化能力缺失的典型表現(xiàn)。"他以工業(yè)機械臂為例,說明現(xiàn)有數(shù)據(jù)集在設備型號、操作流程、環(huán)境參數(shù)等方面存在嚴重碎片化問題。
京東的數(shù)據(jù)戰(zhàn)略展現(xiàn)出獨特的生態(tài)優(yōu)勢。依托覆蓋3600個智能倉庫、1.2萬家零售門店和20萬醫(yī)藥終端的服務網(wǎng)絡,其數(shù)據(jù)采集場景天然具備多模態(tài)特征。從自動化分揀線的機械臂操作,到藥房抓藥機器人的精準動作,再到家政機器人的復雜環(huán)境交互,這些真實業(yè)務場景產(chǎn)生的結構化數(shù)據(jù),為模型訓練提供了豐富的負樣本和邊緣案例。
















