:::
2025-11-08
Kimi K2 Thinking在基準測評中展現卓越表現
【Kimi K2 Thinking在評估推理、編碼和代理能力的基準測評中創造了新記錄】11月8日訊,據月之暗面官網稱,Kimi K2 Thinking在評估推理、編碼和代理能力的基準測評中創造了新的記錄。K2 Thinking在HLE基準評測中取得44.9%的SOTA成績,在BrowseComp測試中達到60.2%,在SWE-Bench Verified測試中達到71.3%,顯示出作爲最先進的思考代理模型的強大泛化能力。
最新市場快訊
13:18:25
12:59:56
12:47:48
12:18:59