阿里巴巴突然出手:開源機器人AI直指谷歌、英偉達
阿里巴巴集團(BABA.N)發佈了一款可幫助機器人及其他設備執行現實世界任務的AI模型,在邁向最終主導多個AI領域的目標上再進一步。
該模型被命名爲RynnBrain,是一款可與環境互動的開源基礎模型,能夠理解時間維度下的空間關係,並推演完成任務所需的步驟。從描述來看,它可用於物體建模、軌跡預測,並能在廚房或工廠裝配線等複雜、擁擠的環境中實現自主導航。
RynnBrain基於阿里巴巴的Qwen3-VL視覺語言模型訓練而成,目前已在Hugging Face和GitHub等平臺上線,提供多個版本,參數規模從最小的20億參數到效率更高的混合專家模型不等。
據瞭解,RynnBrain包含7個全系列模型,其中最引人注目的是業界首個30B MoE架構的具身模型。RynnBrain首次賦予機器人時空記憶和空間推理能力,使其能夠在複雜環境中進行可靠規劃和深度理解。
具身智能的發展一直面臨智能水平瓶頸,尤其是模型的泛化能力有待提升。RynnBrain通過引入時空記憶和物理世界推理克服了不少難題。其時空記憶能力讓機器人能夠在完整的歷史記憶中定位物體、目標區域,甚至預測運動軌跡,賦予機器人全局時空回溯能力。
物理空間推理則通過文本與空間定位交錯進行的策略,確保推理過程緊密紮根於物理環境,大大減弱了幻覺問題。例如,運行RynnBrain的機器人在執行任務時被中斷,能夠記住任務的時間和空間狀態,之後繼續完成任務。
達摩院具身智能實驗室負責人趙德麗表示,RynnBrain首次實現了大腦對物理世界的深度理解與可靠規劃,爲通用具身智能邁出了關鍵一步,有望加速AI從數字世界走向真實物理場景的落地進程。
隨著該模型發佈,阿里巴巴正面迎戰包括Alphabet Inc.(GOOGL.O)旗下谷歌以及英偉達(NVDA.O)在內的AI領先者。阿里巴巴稱,其在基準測試中的表現達到了最先進水平,優於谷歌的Gemini Robotics-ER 1.5以及英偉達的Cosmos-Reason2。
該模型的設計部分著眼於一個各國正在激烈爭奪主導權的領域。中國企業在AI領域總體更傾向於開源路線,這與美國將前沿技術封閉在專有體系內的做法形成對比。實體AI領域的開源策略有望吸引全球開發者和研究人員共同完善相關技術,從而削弱西方的領先地位。