小米MiMo发布HySparse架构：为Agent时代超长文本处理带来高效新方案

时间：2026-02-08 08:19:08 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

在Agent模型与应用迅猛发展的当下，如何精准且高效地处理超长文本，已成为大模型领域亟待攻克的关键难题。Agent不仅要能在超长上下文中完成稳定的检索、推理以及多轮规划任务，还需在推理阶段保持足够快的响应速度。此时，最大的挑战已从“能否计算”转变为“能否算得起”。

面对这一挑战，小米MiMo大模型团队推出了HySparse架构，这是一种专为Agent时代打造的混合稀疏注意力架构。该架构采用“极少的全注意力（Full Attention）+ 稀疏注意力（Sparse Attention）”的核心设计理念，旨在实现效果与效率的完美平衡。

在多项通用、数学、代码以及中文评测中，HySparse架构展现出了卓越的性能。无论是7B Dense规模还是80B MoE规模，HySparse均能为模型带来显著提升。以80B - A3B MoE模型实验为例，在总共49层的模型中，HySparse仅保留5层Full Attention，却依然能够保持甚至提升模型的整体能力。同时，KV Cache存储降低至原来的1/11，真正做到了在保证效果的同时大幅提升效率。

RULER长文测试的结果进一步证明了HySparse架构的优势。即便将Full Attention层压缩到极少数，该架构也能稳定地保持对长距离关键信息的访问能力，充分彰显了其混合稀疏结构的独特魅力。

HySparse架构的创新之处在于其采用了hybrid block结构。每个hybrid block由1层Full Attention和N层Sparse Attention组成。在hybrid block内部，Sparse Attention层不再独立进行token选择和维护全量KV，而是直接复用前置Full Attention层生成的重要token索引和KV Cache。这一设计背后的逻辑在于，Full Attention在完成自身计算的同时，已经生成了KV Cache，并且计算出了最准确的token重要性信息，后续的N个Sparse Attention层自然可以直接复用这些信息。

可以认为，HySparse架构是在MiMo - V2 - Flash的Hybrid SWA结构基础上进行的优化升级。它为SWA增加了全局的、更重要的token信息补充，这一改进不仅提升了模型性能，而且没有增加KV Cache存储，也没有显著增加计算开销。

目前，小米MiMo团队已计划在更大规模的模型上进一步验证HySparse架构的极限和潜力。同时，团队还将持续探索降低Full Attention层数量的可能性，力求让超长上下文的处理变得更加高效。HySparse架构为Agent时代的超长文本处理提供了高效精准的技术解决方案，也为大模型高效注意力结构的研究与落地提供了全新的参考范例。

这一设计不仅提升了车辆的运动感，也有助于降低风阻，提高行驶稳定性。宽大的轮胎配置（前265/40R21，后295/35R21）不仅提升了抓地力，也为车辆提供了更好的操控体验。小米的这一新作，势必将推动行业的进…

随着2026年春节的临近，内蒙古地区为应对日益增长的新能源汽车出行需求，积极部署高速公路充电设施，确保广大新能源车主的顺畅出行。至今，全区高速公路服务区已配置了1827把充电枪，极大地提升了充电便利性。为了帮…

【CNMO科技消息】近日，CNMO注意到，在工业和信息化部最新公布的第404批《道路机动车辆生产企业及产品公告》中，小米汽车旗下全新高性能电动SUV——小米YU7GT正式完成申报，标志着这款备受期待的车型即将…

我当时托朋友找关系才约到一次试驾，销售小哥全程讲的都是“赛道调校”“电机扭矩分配”这些硬核内容，连我问“日常开会不会太颠”都被轻描淡写带过——那时候我觉得，小米这高端化玩得挺像回事儿，就是有点“不接地气”。我…

快科技2月7日消息，在工业和信息化部第404批《道路机动车辆生产企业及产品公告》中，小米YU7GT正式亮相。按照消息人士的说法，YU7GT已进入实车测试阶段，多次现身纽博格林北环赛道进行高强度调校。新车将配备…

自1月底起，SU7Ultra不再仅由部分门店的UltraMaster销售，所有小米汽车门店的销售人员均可为用户提供专业咨询和选购服务。小米汽车强调，此次销售策略的调整旨在提升用户的服务体验，增加销售网点及销售…

中国重汽此次专利成果为行业提供了新的技术范式，其评估方法有望成为商用车自动驾驶测试的通用标准，推动整个产业链的技术协同发展。您认为，这种基于实际场景的、注重量化评估的自动驾驶技术，是否会成为未来商用车领域的主…

随着2026年春节的临近，内蒙古地区为迎接新能源汽车的出行高峰，提前布局了高速公路充电设施，确保每一位新能源车主都能顺畅出行。至今，全区的高速公路服务区已经配备了1827个充电枪，为长途驾驶提供了强有力的支持…

日前，网上流传出一则东风奕派007发生碰撞事故，后座车门打不开的视频，再次让汽车门把手安全问题成为外界关注焦点问题。工业和信息化部科技司有关负责人表示，汽车车门把手标准，不仅是技术问题、设计问题，更是安全问题…

这篇文章来分析太空新竞赛：2025年末，国际电信联盟官网出现了一条引发全球瞩目的消息：中国一次性提交了20.3万颗低轨卫星的频率与轨道资源申请，这个数字相当于当时全球在轨卫星总数的15倍，与此同时，Space…

2026年春节假期临近为更好地保障新能源汽车充电需求内蒙古在运营高速公路服务区共设置充电枪1827枪大家可以通过高德、百度APP"蒙马充电"和"e路畅通"小程序查询高速公路服务区充电设施…

开营仪式上，学术导师们详细拆解了本次访学的学习目标与行程安排，清晰的规划让我对接下来的学习方向有了明确认知。下午我们开启了香港科技大学校园参访之旅，漫步在香港科技大学的校园里，古老建筑的历史韵味与现代设施…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.