2025年6月6日,第七屆智源大會在北京召開,智源研究院正式發布了“悟界”系列大模型,聚焦多模態、腦科學、具身智能與微觀生命分子建模四大核心方向。智源研究院王仲遠關于大模型與AGI發展的觀點,揭示了當前技術發展的關鍵階段與挑戰,以下從技術邏輯與產業視角進行結構化分析:
一、核心觀點解析
-
大模型通向物理AGI的技術轉折點
-
物理世界建模突破:當前大模型已從純符號推理轉向物理規律建模(如流體力學、材料特性預測),表明其開始理解物理世界底層規則。
-
多模態感知融合:視覺-語言-傳感器數據的聯合訓練(如具身視覺導航模型)正構建跨模態世界模型,這是物理AGI的基礎設施。
-
仿真引擎協同進化:NVIDIA Isaac Sim等物理引擎與LLMs結合,通過數字孿生提供萬億次試錯訓練環境。
-
具身智能處于"前GPT-3時代"
-
數據匱乏瓶頸:機器人真實交互數據量(如UC Berkeley的DEC數據集僅10萬條)相比GPT-3訓練數據差5個數量級。
-
動作泛化難題:當前機器人策略模型在unseen場景的零樣本遷移成功率普遍<30%(MIT《Science Robotics》2024)。
-
成本約束:單臺具身智能設備(如Figure 01)硬件成本超25萬美元,限制規;瘮祿占
二、技術突破路徑
-
物理AGI關鍵使能技術
-
神經微分方程:MIT團隊使用神經常微分方程構建可微物理模擬器,使LLMs能通過梯度下降優化物理參數。
-
材料知識圖譜:DeepMind構建包含2.8萬種材料特性的AtomGraph,為大模型提供結構化物理知識。
-
因果推理模塊:Meta在LLMs中植入因果發現算法,在機器人任務中使因果推理準確率提升47%。
-
具身智能發展路線圖
-
仿真優先策略:Google RT-X項目顯示,在仿真環境中預訓練可使真實世界操作成功率提升3.2倍。
-
跨形態知識遷移:斯坦福《Virtual to Real》研究表明,無人機訓練數據可通過特征解耦遷移至機械臂控制。
-
低成本數據采集:UC Berkeley開源的OP3機器人平臺將單臺成本壓縮至5萬美元級。
三、產業落地時間窗預測
技術方向 |
實驗室突破期 |
工業應用期 |
成熟期 |
物理模擬AGI |
2023-2025 |
2026-2028 |
2029+ |
消費級具身智能 |
2025-2027 |
2028-2030 |
2031+ |
工業級具身智能 |
2024-2026 |
2027-2029 |
2030+ |
數據來源:麥肯錫《AI物理系統發展報告2024》
四、待攻克挑戰
-
物理常識表征:當前大模型對"玻璃脆性"等基礎物理屬性的理解準確率僅61%(艾倫研究所測評)。
-
能量效率瓶頸:具身智能設備每決策耗能超200W,遠超生物大腦(約20W)。
-
安全驗證體系:缺乏適用于物理AGI的形式化驗證方法,現有測試覆蓋率不足40%。
五、戰略建議
-
建立物理常識基準測試:建議參考智源"悟道"大模型評測體系,構建涵蓋力學/熱學/電磁學的標準化測試集。
-
開發仿真-現實數據橋接:重點投資NeRF+物理引擎的混合仿真技術,降低真實數據依賴。
-
布局神經符號系統:融合LLMs與符號推理(如Wolfram Alpha引擎),提升物理規律演繹能力。
當前技術拐點要求學術界與產業界在物理建模方法、低成本機器人平臺、能耗優化三個維度形成攻關合力,方能在2030年前實現物理AGI的關鍵突破。未來 3 年內,突破性的規模化應用最可能首先出現在特定、相對封閉的場景,尤其有大量重復、枯燥甚至危險的任務,非常適合具身智能第一波切入。 |