:::
2026-06-05
通義實驗室發布PawBench評測基準,推動智能體技術發展
【通義實驗室推出通用智能體評測基準PawBench】6月5日訊,通義實驗室推出評測基準PawBench,v1.0版本已開源。它面向個人助理與通用智能體場景,將底座模型與運行框架(Harness)納入同一評測體系。據介紹,PawBench不是單純做一個模型排行榜,而是把“模型、Harness、任務”三者放在一起做交叉評測。
最新市場快訊
20:52:24
20:51:52
20:51:24
20:50:43