:::
2026-05-30
小米MiMo-V2.5系列模型推理系統技術公開
【小米MiMo首次公開模型推理系統全鏈路優化技術細節】5月30日訊,5月30日,小米正式公開MiMo-V2.5系列模型的推理系統全鏈路優化方案。據小米方面介紹,團隊圍繞Hybrid SWA+MoE+多模態的複合架構,系統性重構了從KVCache管理、分級緩存、前綴緩存到調度策略與Prefill/Decode鏈路的完整推理棧,KVCache存儲壓縮至同級方案的約1/7,在長序列場景下推理成本大幅下降——這是本次降價的核心技術基礎。5月27日,MiMo-V2.5系列API完成永久降價,最高降幅達99%,不區分輸入長度。
最新市場快訊
20:53:06
20:38:12
20:33:23
20:31:00
20:13:04