2025年6月6日,第七屆智源大會(huì)在北京召開(kāi),智源研究院正式發(fā)布了“悟界”系列大模型,聚焦多模態(tài)、腦科學(xué)、具身智能與微觀生命分子建模四大核心方向。智源研究院王仲遠(yuǎn)關(guān)于大模型與AGI發(fā)展的觀點(diǎn),揭示了當(dāng)前技術(shù)發(fā)展的關(guān)鍵階段與挑戰(zhàn),以下從技術(shù)邏輯與產(chǎn)業(yè)視角進(jìn)行結(jié)構(gòu)化分析:
一、核心觀點(diǎn)解析
-
大模型通向物理AGI的技術(shù)轉(zhuǎn)折點(diǎn)
-
物理世界建模突破:當(dāng)前大模型已從純符號(hào)推理轉(zhuǎn)向物理規(guī)律建模(如流體力學(xué)、材料特性預(yù)測(cè)),表明其開(kāi)始理解物理世界底層規(guī)則。
-
多模態(tài)感知融合:視覺(jué)-語(yǔ)言-傳感器數(shù)據(jù)的聯(lián)合訓(xùn)練(如具身視覺(jué)導(dǎo)航模型)正構(gòu)建跨模態(tài)世界模型,這是物理AGI的基礎(chǔ)設(shè)施。
-
仿真引擎協(xié)同進(jìn)化:NVIDIA Isaac Sim等物理引擎與LLMs結(jié)合,通過(guò)數(shù)字孿生提供萬(wàn)億次試錯(cuò)訓(xùn)練環(huán)境。
-
具身智能處于"前GPT-3時(shí)代"
-
數(shù)據(jù)匱乏瓶頸:機(jī)器人真實(shí)交互數(shù)據(jù)量(如UC Berkeley的DEC數(shù)據(jù)集僅10萬(wàn)條)相比GPT-3訓(xùn)練數(shù)據(jù)差5個(gè)數(shù)量級(jí)。
-
動(dòng)作泛化難題:當(dāng)前機(jī)器人策略模型在unseen場(chǎng)景的零樣本遷移成功率普遍<30%(MIT《Science Robotics》2024)。
-
成本約束:?jiǎn)闻_(tái)具身智能設(shè)備(如Figure 01)硬件成本超25萬(wàn)美元,限制規(guī);瘮(shù)據(jù)收集。
二、技術(shù)突破路徑
-
物理AGI關(guān)鍵使能技術(shù)
-
神經(jīng)微分方程:MIT團(tuán)隊(duì)使用神經(jīng)常微分方程構(gòu)建可微物理模擬器,使LLMs能通過(guò)梯度下降優(yōu)化物理參數(shù)。
-
材料知識(shí)圖譜:DeepMind構(gòu)建包含2.8萬(wàn)種材料特性的AtomGraph,為大模型提供結(jié)構(gòu)化物理知識(shí)。
-
因果推理模塊:Meta在LLMs中植入因果發(fā)現(xiàn)算法,在機(jī)器人任務(wù)中使因果推理準(zhǔn)確率提升47%。
-
具身智能發(fā)展路線圖
-
仿真優(yōu)先策略:Google RT-X項(xiàng)目顯示,在仿真環(huán)境中預(yù)訓(xùn)練可使真實(shí)世界操作成功率提升3.2倍。
-
跨形態(tài)知識(shí)遷移:斯坦!禫irtual to Real》研究表明,無(wú)人機(jī)訓(xùn)練數(shù)據(jù)可通過(guò)特征解耦遷移至機(jī)械臂控制。
-
低成本數(shù)據(jù)采集:UC Berkeley開(kāi)源的OP3機(jī)器人平臺(tái)將單臺(tái)成本壓縮至5萬(wàn)美元級(jí)。
三、產(chǎn)業(yè)落地時(shí)間窗預(yù)測(cè)
技術(shù)方向 |
實(shí)驗(yàn)室突破期 |
工業(yè)應(yīng)用期 |
成熟期 |
物理模擬AGI |
2023-2025 |
2026-2028 |
2029+ |
消費(fèi)級(jí)具身智能 |
2025-2027 |
2028-2030 |
2031+ |
工業(yè)級(jí)具身智能 |
2024-2026 |
2027-2029 |
2030+ |
數(shù)據(jù)來(lái)源:麥肯錫《AI物理系統(tǒng)發(fā)展報(bào)告2024》
四、待攻克挑戰(zhàn)
-
物理常識(shí)表征:當(dāng)前大模型對(duì)"玻璃脆性"等基礎(chǔ)物理屬性的理解準(zhǔn)確率僅61%(艾倫研究所測(cè)評(píng))。
-
能量效率瓶頸:具身智能設(shè)備每決策耗能超200W,遠(yuǎn)超生物大腦(約20W)。
-
安全驗(yàn)證體系:缺乏適用于物理AGI的形式化驗(yàn)證方法,現(xiàn)有測(cè)試覆蓋率不足40%。
五、戰(zhàn)略建議
-
建立物理常識(shí)基準(zhǔn)測(cè)試:建議參考智源"悟道"大模型評(píng)測(cè)體系,構(gòu)建涵蓋力學(xué)/熱學(xué)/電磁學(xué)的標(biāo)準(zhǔn)化測(cè)試集。
-
開(kāi)發(fā)仿真-現(xiàn)實(shí)數(shù)據(jù)橋接:重點(diǎn)投資NeRF+物理引擎的混合仿真技術(shù),降低真實(shí)數(shù)據(jù)依賴。
-
布局神經(jīng)符號(hào)系統(tǒng):融合LLMs與符號(hào)推理(如Wolfram Alpha引擎),提升物理規(guī)律演繹能力。
當(dāng)前技術(shù)拐點(diǎn)要求學(xué)術(shù)界與產(chǎn)業(yè)界在物理建模方法、低成本機(jī)器人平臺(tái)、能耗優(yōu)化三個(gè)維度形成攻關(guān)合力,方能在2030年前實(shí)現(xiàn)物理AGI的關(guān)鍵突破。未來(lái) 3 年內(nèi),突破性的規(guī);瘧(yīng)用最可能首先出現(xiàn)在特定、相對(duì)封閉的場(chǎng)景,尤其有大量重復(fù)、枯燥甚至危險(xiǎn)的任務(wù),非常適合具身智能第一波切入。 |