滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

小米MiMo-V2.5-Pro UltraSpeed模式发布：通用GPU实现1T模型超千tokens/s推理

时间：2026-06-10 05:09:44 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能领域，一场关于模型推理速度的突破性进展引发行业震动。MiMo模型团队与TileRT系统团队联合宣布，其最新研发的Xiaomi MiMo-V2.5-Pro模型UltraSpeed模式，在标准通用GPU环境下实现万亿参数（1T）模型推理速度突破1000tokens/s，这一成果标志着AI应用范式即将迎来根本性变革。

传统技术路径中，追求极致推理速度往往需要依赖专用硬件架构。此次突破性成果完全基于8卡标准GPU节点实现，通过模型与系统的深度协同设计（Codesign），在保持模型精度的前提下，将硬件资源利用率提升至全新高度。研发团队采用FP4量化技术，仅对MoE架构中的专家模块进行量化处理，既压缩了90%的模型体积，又确保关键能力不受影响。配合DFlash投机解码算法，通过块级并行预测和滑动窗口注意力机制，使推理过程摆脱传统串行约束，在代码生成场景中实现平均6.30tokens的连续接受长度。

系统层面的创新同样关键。TileRT执行框架引入常驻内核引擎，将计算流水线永久驻留GPU内存，使数据搬运与计算操作实现完全重叠。通过异构流水线协作技术，将通信、数据搬运和张量计算拆解至线程束级别，构建出精密协作的异构执行系统。这种软硬件深度融合的设计，使得编译引擎与计算核能够针对FP4量化和DFlash算法进行微秒级优化，最终在通用硬件上实现专用芯片级的推理性能。

此次技术突破将直接改变多个领域的运作模式。在金融交易领域，毫秒级响应能力使高频量化策略获得更精准的决策窗口；医疗场景中，实时影像分析为手术操作争取宝贵时间；开发领域则迎来代码生成效率的质的飞跃——开发者可同时验证数十条推理路径，通过自动纠错机制显著提升输出质量。某量化交易机构实测显示，接入该技术后策略执行延迟降低87%，年化收益提升3.2个百分点。

该技术采用限时开放策略，2026年6月9日至6月23日期间，开发者可通过申请制体验UltraSpeed模式。API服务定价为标准版的3倍，但提供10倍的输出速度提升，不过该服务仅支持API调用，暂不开放TokenPlan订阅。为保障资源合理分配，系统设置每日最多10次队列进入权限，单次会话时长限制为30分钟，空闲超5分钟将自动释放资源。这项突破不仅证明通用GPU的潜力尚未完全开发，更为AI基础设施的演进指明新方向——通过算法与系统的协同创新，在现有硬件框架内挖掘出指数级性能提升空间。

更多>同类资讯

大众ID.4停产后“接棒者”亮相！ID.途观谍照首曝外观内饰动力全面升级

07-01

瑞银调研：六成企业收紧AI开支，开源模型及本土大模型或迎发展契机

07-01

小米米家手持风扇新绿色款登场：百挡调速超长续航，众筹价169元即将上市

07-01

小米超级小爱已支持控制微信，一句话发消息、打电话

7 月 1 日消息，微信正在与华为、荣耀、小米、OPPO、vivo 等手机厂商合作推出 A2A 助手能力，相关功能正在逐步开放中。测试发现，小米的超级小爱已经接入微信 A2A，支持一句话给微信好友发消息、打电话。超级小爱的隐私设置中将出现“微信语音控制开关”选项。目前荣耀

07-01

马斯克的“银行”：X Money美国上线，年化收益6%

07-01

马斯克X Money上线首日，网友给全球首富打款25美元

07-01

特斯拉公布超级芯片工厂首位高管英特尔17年老将加盟

07-01

最高99万元的仿生机器人真要进家了

07-01

骁龙8E6旗舰集体涨价，起步价突破6000元

07-01

鸿蒙智行车道级导航+全新辅助驾驶免费领一年

07-01

小米18首发徕卡双2亿像素：小米最强标准版旗舰

07-01

小米人事调整：王晓雁不再兼任销售运营一部总经理

07-01

自变量200亿估值背后，具身智能在给什么定价

07-01

拼多多豪掷5亿布局雄安：成立新公司购置整栋办公楼员工规模超600人

07-01

华为Mate 80 RS非凡大师优惠来袭，1000元直降+12期免息，10999元起售

07-01

点击查看更多 +

全站最新

阿维塔获L3自动驾驶测试牌照多场景道路实测正有序推进

中国汽车产业破局：告别“互黑内卷” 共赴技术品质竞争新征程

出境游旺季语言成难题？讯飞AI眼镜轻装上阵，多语种翻译助力跨境出行沟通无阻

科大讯飞研究院2027届飞星计划启航邀你共赴AI未来新征程

Coffee AI Sound殿堂声音响系统夺冠，彰显中国品牌智能声学技术新高度

法拉利首款纯电Luce亚洲首秀引热议：88台配额锁定订金40万起试驾待明年

热门内容

本栏最新

中国汽车产业破局：告别“互黑内卷” 共赴技术品质竞争新征程

出境游旺季语言成难题？讯飞AI眼镜轻装上阵，多语种翻译助力跨境出行沟通无阻

科大讯飞研究院2027届飞星计划启航邀你共赴AI未来新征程

Coffee AI Sound殿堂声音响系统夺冠，彰显中国品牌智能声学技术新高度

6月车企销量大比拼：极石、小米、理想等齐发力，零跑鸿蒙智行创新高

小红书内部启动达尔文项目，或为IPO铺路，拟再造一个现象级产品

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.