:::
2026-06-25
VitaBench 2.0:開創智能體評測的新標準
【美團LongCat開源 VitaBench2.0:長期動態智能體基準新標桿】6月25日訊,VitaBench 2.0是首個真實生活場景下面向長期動態用戶建模的智能體評測基準,它系統性地評測大語言模型在長期、真實、動態的用戶互動中個性化與主動性的能力。(美團技術)
最新市場快訊
21:31:29
21:30:50
21:27:33