跳到主要內容
:::
  1. 首頁
  2. 市場快訊
2025-09-19

小米開源創新語音模型的技術突破與性能表現

【小米開源首個原生端到端語音大模型】9月19日訊,9月19日,小米正式開源首個原生端到端語音模型——Xiaomi-MiMo-Audio,它基於創新預訓練架構和上億小時訓練數據,首次在語音領域實現基於ICL的少樣本泛化,並在預訓練觀察到明顯的“湧現”行爲。據介紹,在通用語音理解及對話等多項標準評測基準中,MiMo-Audio大幅超越了同參數量的開源模型,取得7B最佳性能;在音頻理解基準MMAU的標準測試集上,MiMo-Audio超過Google閉源語音模型Gemini-2.5-Flash;在面向音頻複雜推理的基準Big Bench Audio S2T任務中,MiMo-Audio同樣超越了OpenAI閉源的語音模型GPT-4o-Audio-Preview。
最新市場快訊
::: Capital Securities Capital Inv. Cons. Capital Insurance Capital Asset Mgmt. Capital HK
Futures Corporation:(02)2700-2888
B1, No. 97, Section 2, Dunhua South Road, Taipei City
Taichung Branch:(04)2319-9909
3F-6, No. 633, Sec. 2, Taiwan Blvd, Xitun Dist, Taichung City
Passed Level A Web Accessibility Testing