ITBear旗下自媒体矩阵:

小米MiMo-V2.5-Pro推出UltraSpeed模式:限时体验价享3倍价10倍速

   时间:2026-06-09 09:50:00 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

小米MiMo与TileRT联合宣布,正式推出Xiaomi MiMo-V2.5-Pro的UltraSpeed模式。该模式通过模型与系统的深度协同设计,在通用GPU上实现了万亿参数模型生成速度的重大突破,首次达到每秒1000 tokens的里程碑。这一技术进展标志着大模型推理效率进入全新阶段,为实时交互应用提供了更强大的算力支持。

同步上线的MiMo-V2.5-Pro-UltraSpeed API采用差异化定价策略,其价格设定为标准版的三倍,但输出速度提升约十倍。需要注意的是,该服务仅支持API调用模式,不兼容原有的Token计费计划。根据公开资料,标准版MiMo-V2.5-Pro的输入成本为每百万tokens 0.025元(缓存命中场景)或3元(未命中场景),输出成本为每百万tokens 6元。

由于高速推理资源处于限量供应状态,此次UltraSpeed模式将采取申请制分阶段开放。符合条件的企业用户和专业开发者可在2026年6月9日至6月23日期间提交接入申请,审核通过后将获得为期两周的限时体验权限。小米官方特别说明,资源分配将优先保障具有明确商业需求的技术场景,但不对申请审核的时效性和通过率作出承诺。

为确保服务质量和资源公平使用,试用期间实施严格的使用限制:每个账号每日最多进入服务队列10次,单次会话时长不得超过30分钟,若会话空闲超过5分钟系统将自动释放资源。这些措施旨在平衡技术创新与资源可持续性,为真正需要高性能推理能力的开发者提供稳定支持。

开发者可通过指定平台提交申请,具体路径为:平台入口(platform.xiaomimimo.com/ultraspeed)用于资源申请,体验入口(ultraspeed.xiaomimimo.com)提供交互服务。此次限时开放标志着小米在大模型商业化领域迈出重要一步,其技术突破与运营策略的组合实施,或将引发行业对高性能推理服务模式的深入探讨。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version