滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI也需“睡眠”充电？大模型“小憩”后推理能力显著提升

时间：2026-05-27 19:43:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

卡内基梅隆大学与马里兰大学的研究团队在人工智能领域取得一项突破性进展——他们为大语言模型设计了类似人类睡眠的机制，以解决长文本处理中的性能瓶颈问题。这项研究的核心发现是，当模型处理复杂推理任务时，强制"休息"并进行多轮信息整合，能显著提升其逻辑推导能力。

传统Transformer架构在处理长上下文时面临双重挑战：注意力机制的计算量随文本长度平方级增长，同时KV缓存的线性膨胀导致内存压力剧增。现有解决方案要么直接丢弃早期信息，要么采用SSM+Attention混合架构压缩历史数据。但研究团队发现，即便快速权重仍有存储空间，模型在处理多步骤推理时仍会因单次前向传播的局限性而失效，这与人类无法即时消化所有经历的现象颇为相似。

受人类睡眠机制的启发，研究人员构建了离线信息整合流程。当模型接近上下文窗口上限时，系统会暂停接收新输入，进入"睡眠"状态。在此阶段，模型通过多轮递归前向传播反复提炼已有信息，利用可学习的局部规则更新快速权重，完成深度知识压缩。这个过程中，KV缓存被清空以释放内存，模型醒来后携带更新后的参数继续工作。

实验采用元胞自动机、多跳图检索和无限数学推理三类任务进行验证。结果显示，增加"睡眠"迭代次数能持续提升模型表现，尤其在需要多步骤逻辑推导的复杂任务中效果显著。简单任务单次处理即可完成，而高难度问题则需要多轮信息打磨才能理清思路。值得注意的是，所有额外计算开销都集中在离线整合阶段，正常推理流程仍保持单次前向传播的效率。

这项研究为解决大模型的长文本处理难题提供了新思路。通过模拟人类记忆巩固机制，模型在保持实时处理能力的同时，获得了深度思考的空间。这种张弛有度的工作模式，或许正是突破当前技术瓶颈的关键所在。当AI学会在适当时候"打个盹"，其处理复杂问题的能力反而得到了质的提升。

更多>同类资讯

图灵奖得主迪菲智源大会发声：未来程序可靠性提升需聚焦形式化方法

06-13

余承东再挑重担：力推盘古大模型，鸿蒙智能迈向新征程

06-13

华为云携手MiniMax：昇腾算力赋能M3模型，打通企业生产力闭环

06-13

华为开发者大会亮点多：鸿蒙7开启智能新篇，余承东誓夺大模型行业第一

他说华为其实是国内最早发布大模型的公司，早在全中国、甚至全球绝大多数从业者连大模型概念都还没摸清的时候，华为就已经把盘古大模型做出来并落地了。华为不一样，它的大模型是直接嵌在系统里的，从鸿蒙7 的底层就打…

06-13

大朋以PCVR技术优势切入具身智能领域，打造数据采集新方案赋能产业落地

作为 PCVR 细分市场领跑者，稳居行业第一席位，大朋凭借在空间交互、低延迟传输、硬件工程等领域的长期技术积淀，推出的RoboPilot 机器人遥操作与真机数据采集解决方案：产品深度布局具身智能前端数据链路，…

06-13

华为何波：AIDC能源转型需分三步走源网荷储协同成关键路径

【CNMO科技消息】6月10日，CNMO科技注意到，华为数字能源副总裁何波在做客人民网《人民会客厅》时表示，AI产业发展正在带动数据中心形态演进，算力设备持续运行需要稳定、高效、可持续的电力支撑。在这一背景下…

06-13

轻量化智能眼镜实测：AI赋能如何让日常沟通创作与记录更高效？

这款设备做到了两件核心的事：第一，它保持了普通眼镜的轻量化外形，不会让你在人群中显得突兀；第二，它把AI能力无缝嵌入到你眼前的视野里，实现一种“无感交互”的新状态。如果你也时常觉得被手机通知和操作流程打断，…

06-13

2026复旦暑期论坛：生命组学大数据与AI融合，共探精准医疗新路径

为此在复旦大学生命科学学院和现代人类学教育部重点实验室/上海市遗传学会的共同支持下特举办本次暑期论坛，采用“理论讲解和上机实训相结合”的形式，现场和线上同步开展，旨在满足多组学大数据分析培训的巨大需求并为相…

06-13

科技助力生态守护："空天地五基协同"开启全域监测新篇章

06-13

2026华为开发者大会启幕 HarmonyOS 7携五大发布开启Agent时代新篇

06-12

华为开发者大会发布HarmonyOS 7 Beta版开启鸿蒙Agent智能化新篇章

06-12

华为开发者大会发布HarmonyOS 7：空间计算与智能Agent架构引领全场景新体验

06-12

华为开发者大会发布HarmonyOS 7，Agent架构重构技术底座启动鸿图计划

06-12

广汽昊铂S600正式登场：双动力4款车型，权益价17.99万起开启新豪华体验

06-12

华为HarmonyOS 7重磅登场：空间计算革新体验，Agent架构引领智能新潮流

06-12

点击查看更多 +

全站最新

广汽昊铂S600正式登场：双动力4款车型，权益价17.99万起开启新豪华体验

奥迪中国CFO罗彼得：AUDI字母系列品牌战略酝酿三年聚焦运动差异化发展

宝马BMW M新世代概念车首发，四电机配800V架构开启电动新征程

HDC2026看小艺进化：从助手到智慧大脑，重新定义智能体时代交互与服务

小米汽车YU7实测续航亮眼，全系安全配置“一视同仁”无差别

红米K100系列配置大升级，大屏长续航强性能，或告别性价比定位？

热门内容

本栏最新

华为开发者大会亮点多：鸿蒙7开启智能新篇，余承东誓夺大模型行业第一

大朋以PCVR技术优势切入具身智能领域，打造数据采集新方案赋能产业落地

广汽昊铂S600正式登场：双动力4款车型，权益价17.99万起开启新豪华体验

AI赋能未来出行赛豆科技AIVA品牌启航重新定义汽车新生态

赛力斯张兴海谈汽车成本：存储芯片碳酸锂涨价，车企面临双重挑战

拓维信息：扭亏背后暗藏隐忧，“AI×鸿蒙”战略能否撑起高估值？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.