• 虎科技 - 領先的互聯網科技媒體

LeCun直指人形機器人痛點:通用智能尚遠,世界模型才是未來方向

   時間:2025-10-27 23:01 來源:快訊作者:楊凌霄

一場關于人形機器人未來走向的激烈爭論,在科技圈掀起軒然大波。meta首席AI科學家楊立昆(Yann LeCun)在麻省理工學院(MIT)的公開演講中直言,當前機器人行業距離真正的通用智能仍有巨大差距,這一觀點迅速引發特斯拉、Figure等企業高管的反駁。

楊立昆指出,現有機器人技術僅能完成工廠中擰螺絲、搬運貨物等特定任務,但要讓它們在家中疊衣服、倒水或理解人類意圖,仍面臨難以逾越的障礙。他將這種局限歸結為"窄智能"與"通用智能"的本質差異,認為突破關鍵在于構建能夠學習、理解和預測物理世界的"世界模型"架構。

這番言論猶如投入平靜湖面的巨石,立即引發行業震動。特斯拉Optimus AI負責人朱利安·伊巴爾茨(Julian Ibarz)公開表示反對,強調公司內部已形成明確的通用人形機器人實現路徑。Figure創始人布雷特·阿德科克(Brett Adcock)則更直接地喊話:"建議楊立昆別再空談理論,親自下場做些實事。"

追溯楊立昆的學術生涯,其前瞻性研究軌跡頗具傳奇色彩。1987年在索邦大學完成的博士論文《連接主義學習模型》,為神經網絡反向傳播算法奠定了理論基礎。當時主流AI研究仍聚焦專家系統,他卻獨具慧眼地關注到50-60年代科學家對"自組織"問題的探索——即系統如何通過自我組織實現學習。

"生物學為工程提供了豐富靈感,"楊立昆回憶道,"所有生物都具有適應能力,只要擁有神經系統就能學習。這讓我相信,構建智能系統的最佳路徑或許是讓它自行學會變聰明。"這種突破性思維促使他走上機器學習研究道路,盡管當時該領域幾乎無人涉足,甚至導致他一度難以找到博士導師。

在2013年加入Facebook(現meta)后,楊立昆創立FAIR實驗室并推動"深度學習"概念取代"神經網絡",這一術語革新標志著產業界對相關范式的系統性接受。2018年,他因在深度神經網絡領域的突破性貢獻,與約書亞·本吉奧(Yoshua Bengio)、杰弗里·辛頓(Geoffrey Hinton)共同獲得圖靈獎。

此次爭議的核心,在于楊立昆對大語言模型(LLM)的尖銳批評。他直言LLM是"死胡同",強調僅靠文本訓練永遠無法達到人類水平智能。"四歲兒童通過視覺接收的數據量,已超過所有公開文本訓練的最大規模LLM,"他指出,"這些系統只是回憶訓練信息,甚至不如貓的智能水平。"

在楊立昆看來,真正的智能源于視覺、聽覺、觸覺等多模態感知輸入。他以貓為例:雖然貓腦僅含約2.8億個神經元,但其對三維空間的感知、物體穩定性判斷和復雜動作規劃能力,遠超當前所有生成式AI系統。因此,他主張將研究重心轉向"世界模型"——即讓機器能夠預測動作執行后的環境變化。

這種模型的具體應用場景包括:讓機器人通過想象完成沖咖啡等連續動作,預測每一步操作的結果。楊立昆透露,其團隊采用的"環境動力學模型"已實現自監督學習,機器人無需針對特定任務反復訓練,僅通過學習"動作-結果"關系即可零樣本完成新任務。

盡管遭到產業界質疑,但已有企業開始驗證楊立昆的理論。獲得OpenAI投資的挪威公司1X Technologies發布的"世界模型",包含視覺編碼器、動作編碼器等模塊,可對輸入動作質量進行量化評估。該公司首席執行官伯恩特·博尼克(Bernt B?rnich)坦言,讓機器人進入家庭面臨"理想與現實的落差",Wi-Fi連接等基礎問題比機器人技術本身更具挑戰性。

特斯拉則從制造端切入挑戰。馬斯克指出,人形機器人量產所需的供應鏈尚不存在,但公司仍在建設年產百萬臺Optimus機器人的生產線,目標2026年初推出V3原型機。在ICCV計算機視覺頂會上,特斯拉AI負責人阿肖克·埃盧斯瓦米(Ashok Elluswamy)介紹的"神經世界模擬器",可通過車隊視頻數據訓練實現狀態合成,該架構將被遷移至Optimus機器人。

在這場技術路線之爭中,楊立昆還意外透露了自己與Llama大模型的"距離"。他多次強調未參與任何Llama項目的技術開發,并揭秘第一代Llama實質是巴黎研究小組的"海盜項目"——這個十余人團隊在2022年中后期開發的輕量高效模型,最終成為meta的主力產品。雖然小扎在2023年初組建了GenAI團隊推動產品化,但楊立昆堅持表示:"從技術層面說,我確實沒插手。"

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群