金融網

:::

2025-11-08

Kimi K2 Thinking在推理測試中的卓越表現

【Kimi K2 Thinking在多項推理測試中均超過GPT-5】11月8日訊，GPT-5和Claude Sonnet 4.5 Thinking仍然是領先的思考模型。然而，在相同的基準測試中，Kimi K2 Thinking的代理推理得分超過了兩者：例如，在BrowseComp測試中，K2 Thinking以60.2%的分數絕對領先GPT-5的54.9%和Claude的24.1%。K2 Thinking在GPQA Diamond測試中也以85.7%的分數超過了GPT-5的84.5%，在AIME 2025和HMMT 2025等數學推理任務上也與GPT-5不相上下。

最新市場快訊

16:34:23

第二十二屆北京論壇：全球學者聚焦數智時代的文明共生

16:28:59

馬克龍對盧浮宮盜竊案的回應與未來安保計劃

16:21:56

波音公司與美國聯邦航空管理局的持續協調

16:21:42

波音建議MD-11貨機運營商暫停飛行

16:21:23

烏克蘭能源部門與基礎設施面臨的安全挑戰

::: 群益證券群益投顧群益保險群益投信群益香港

網站導覽關於群益公司治理永續發展公平待客反詐騙專區利害關係人網站聲明資訊安全友善服務人才招募金融大回饋

期貨總公司:(02)2700-2888
台北市敦化南路二段97號B1
台中分公司:(04)2319-9909
台中市西屯區台灣大道2段633號3樓之6