小米大模型永久降价99%！MiMo AI规模化应用新突破

过往几个月，我们通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动，让更多人有机会体验 MiMo ，并解决真实的问题——这是 MiMo 在规模化应用道路上的第一步。

而现在，随着底层技术的不断精进，我们终于可以做一件更彻底的事——对整个模型价格体系进行一次永久性翻新。

本次公告核心速览：

MiMo-V2.5 系列 API 永久降价
Token Plan 计费体系优化，用量提升至原来的 5-8 倍
百万亿 Token 创造者激励计划圆满收官
当前有效 Token Plan 用户额度全量重置

生效时间：北京时间 2026 年 5月 27日 0 点

MiMo-V2.5系列API永久降价

相比原始 API 定价，新定价最高降幅可达 99%，且不再区分上下文窗口长度。

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

本次调价于北京时间 5 月 27 日 0:00 正式生效，全球同步调整，诚邀各位开发者接入体验。

TokenPlan 计费体系优化

加量不加价，用量提升至原5-8倍，为您解锁更充沛的生产力

示例：在Agent或Code场景下，可用 Token数量为：

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

计费规则调整，更加清晰易懂，所见即所得。

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

百万亿 Token创造者激励计划圆满收官

「百万亿 Token 创造者激励计划」自 4 月 28 日上线以来，受到全球用户的热情追捧和广泛关注，截至北京时间 5 月 26 日 16:08，100T Tokens 已全部提前发放完毕，活动提前收官、圆满结束，感谢广大开发者的踊跃参与！

注：Apache 软件基金会成员专属福利活动长期有效、可继续申请，不受本次收官影响。

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官

惊喜：现有 TokenPlan 用户额度全量重置

无论当前套餐用量如何，所有已订阅 Token Plan 且当前仍在有效期的用户（包括参与百万亿 Token 创造者激励计划并获得 Token Plan 的用户，涵盖 Apache 软件基金会专属福利用户）的 Credits 额度将于北京时间 5 月 27 日 0:00 全量重置，并按新计费规则执行。

One More Thing：针对 Token Plan 已过期的历史付费用户，我们也同样准备了惊喜好礼，将在未来一周宣布，请保持关注。

推理技术优化说明

本次价格调整背后，离不开小米技术团队在推理系统上的持续优化。

我们基于 SGLang HiCache 完整支持 SWA（Sliding Window Attention），将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近 1/7，并将可缓存 token 数量提升至优化前的近 5 倍，显著提升了缓存命中率和推理效率。

同时，我们通过优化专家并行方案、输入长度分桶策略等，进一步提升了集群输入吞吐能力，从而在保障服务质量的前提下持续降低单位 token 服务成本。

后续我们将发布更加详细的推理优化技术 Blog，敬请期待。

结语

技术的价值，最终要体现在被使用的广度上。

依靠技术的持续创新，我们希望通过提供兼具低成本与顶尖能力的模型服务，撬动真实、持续、规模化的推理需求，推动完整 AI 基础设施链条的建设。

让更多的人能用到更好的模型——这是 MiMo 不变的使命。

MiMo-V2.5 系列调价公告丨百万亿 Token 创造者激励计划收官