:::
2026-03-10
騰訊推出全新強化學習後訓練框架WorldCompass
【騰訊混元開源首個面向世界模型的強化學習後訓練框架】3月10日訊,騰訊混元3D團隊開源首個面向世界模型的強化學習後訓練框架WorldCompass。據介紹,這是一個專爲長時序、交互式世界模型設計的強化學習(RL)後訓練框架。如果說世界模型是引擎,那麼WorldCompass就是精準的“指南針”,通過引入強化學習機制,直接“引導”模型如何更準確地遵循用戶指令探索世界,並保持長時序的視覺一致性。
最新市場快訊
16:41:36
16:40:28
16:39:57