阿里巴巴突然出手：開源機器人AI直指谷歌、英偉達

schedule 2026/02/10 15:51:03

阿里巴巴集團(BABA.N)發佈了一款可幫助機器人及其他設備執行現實世界任務的AI模型，在邁向最終主導多個AI領域的目標上再進一步。

該模型被命名爲RynnBrain，是一款可與環境互動的開源基礎模型，能夠理解時間維度下的空間關係，並推演完成任務所需的步驟。從描述來看，它可用於物體建模、軌跡預測，並能在廚房或工廠裝配線等複雜、擁擠的環境中實現自主導航。

RynnBrain基於阿里巴巴的Qwen3-VL視覺語言模型訓練而成，目前已在Hugging Face和GitHub等平臺上線，提供多個版本，參數規模從最小的20億參數到效率更高的混合專家模型不等。

據瞭解，RynnBrain包含7個全系列模型，其中最引人注目的是業界首個30B MoE架構的具身模型。RynnBrain首次賦予機器人時空記憶和空間推理能力，使其能夠在複雜環境中進行可靠規劃和深度理解。

具身智能的發展一直面臨智能水平瓶頸，尤其是模型的泛化能力有待提升。RynnBrain通過引入時空記憶和物理世界推理克服了不少難題。其時空記憶能力讓機器人能夠在完整的歷史記憶中定位物體、目標區域，甚至預測運動軌跡，賦予機器人全局時空回溯能力。

物理空間推理則通過文本與空間定位交錯進行的策略，確保推理過程緊密紮根於物理環境，大大減弱了幻覺問題。例如，運行RynnBrain的機器人在執行任務時被中斷，能夠記住任務的時間和空間狀態，之後繼續完成任務。

達摩院具身智能實驗室負責人趙德麗表示，RynnBrain首次實現了大腦對物理世界的深度理解與可靠規劃，爲通用具身智能邁出了關鍵一步，有望加速AI從數字世界走向真實物理場景的落地進程。

隨著該模型發佈，阿里巴巴正面迎戰包括Alphabet Inc.(GOOGL.O)旗下谷歌以及英偉達(NVDA.O)在內的AI領先者。阿里巴巴稱，其在基準測試中的表現達到了最先進水平，優於谷歌的Gemini Robotics-ER 1.5以及英偉達的Cosmos-Reason2。

該模型的設計部分著眼於一個各國正在激烈爭奪主導權的領域。中國企業在AI領域總體更傾向於開源路線，這與美國將前沿技術封閉在專有體系內的做法形成對比。實體AI領域的開源策略有望吸引全球開發者和研究人員共同完善相關技術，從而削弱西方的領先地位。