滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI大模型也有“疲惫时刻”？引入睡眠机制，助力深度推理能力升级

时间：2026-05-28 00:26:27 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

卡内基梅隆大学与马里兰大学的研究团队近日提出一项创新机制：让大语言模型像人类一样通过"睡眠"提升推理能力。这项发表于《Language Models Need Sleep》的研究发现，当模型处理长文本时，若持续运行而不进行信息沉淀，其性能会显著下降，尤其在复杂逻辑推导任务中表现尤为明显。

研究灵感源自神经科学领域对记忆巩固机制的理解。人类睡眠时，海马体会反复回放日间经历，将短期记忆转化为长期知识存储在大脑皮层。受此启发，团队为Transformer架构设计了离线信息处理机制——当模型上下文窗口接近容量上限时，暂停接收新输入，转而通过多轮递归前向传播对已有信息进行深度压缩与整合。

传统模型处理长文本时面临双重挑战：注意力机制的计算复杂度随上下文长度呈平方级增长，同时KV缓存的线性扩张导致内存压力剧增。当前解决方案分为两类：一是强制淘汰旧信息，但会丢失关键上下文；二是采用SSM+Attention混合架构，将历史信息压缩至快速权重模块。然而实验表明，即便快速权重未达容量极限，模型在处理多步推理任务时仍会出现性能断崖式下降。

研究团队将这种性能衰退归因于信息处理深度不足。常规架构下，模型仅有一次前向传播机会完成信息内化，难以支撑复杂逻辑的拆解。这与人脑处理机制形成鲜明对比：人类通过睡眠实现离线信息加工，避免外界干扰的同时，通过多次记忆回放确保知识巩固的充分性。

新设计的"睡眠"机制包含三个关键阶段：当检测到上下文窗口达到阈值时，模型进入纯离线状态；通过可学习的局部规则对全部上下文进行多轮递归处理，逐步更新快速权重参数；最终清空KV缓存并恢复常规推理模式。这种设计将额外计算开销集中在离线阶段，确保模型苏醒后的单次前向传播效率与常规架构持平。

实验采用元胞自动机、多跳图检索和无限数学推理三类任务进行验证。测试结果显示，增加"睡眠"迭代轮次可显著提升模型在深度推理任务中的表现，且性能增益与任务复杂度呈正相关。例如在GSM-Infinite数学推理测试中，经过8轮睡眠处理的模型准确率较基线模型提升23%，而在简单分类任务中则无明显差异。

这种生物启发的设计揭示了模型优化的新方向：通过模拟人类认知节律，在计算效率与推理深度间取得平衡。研究团队指出，未来工作将探索动态睡眠调度策略，使模型能根据任务复杂度自动调节离线处理时长，进一步优化资源分配。

更多>同类资讯

贾跃亭宣布FF机器人6月交付105台，全年出货目标再提至2000台

06-29

AI浪潮下35岁+职场人迎来新机遇：经验叠加技术成职场新优势

06-29

港大团队源策未来获数亿融资，攻克人形机器人全身智能难题启新程

06-29

惠普携手OpenAI推进战略布局：Frontier平台助力业务升级与客户体验提升

IT之家注意到，OpenAI 于今年 2 月宣布推出 OpenAI Frontier，这是一个帮助企业构建、部署和管理 AI智能体的平台。企业可以将现有数据和 AI 一起部署，使其发挥作用，以及集成目前已…

06-29

我国开源生态版图再扩容，AI与具身智能领航，开发者规模全球前列

记者 6 月 26 日从业内获悉，我国开源生态版图进一步扩容，新增了涵盖人工智能、具身智能等领域的 7 个项目。若计入Gitee、AtomGit、GitCode 等国内平台，中国整体开发者规模预计超过 35…

06-29

惠普携手OpenAI推进战略布局：Frontier平台全球业务全面落地助力转型增长

IT之家注意到，OpenAI 于今年 2 月宣布推出 OpenAI Frontier，这是一个帮助企业构建、部署和管理 AI智能体的平台。企业可以将现有数据和 AI 一起部署，使其发挥作用，以及集成目前已…

06-29

北大携手DeepSeek推出DSpark框架：破解大模型推理瓶颈，推动行业技术普惠

06-29

图灵奖得主助力曹操出行，AI战略布局与“双十万计划”双轮驱动未来

06-29

OpenAI再揽苹果大将：Vision Pro前负责人加盟，AI硬件研发提速

06-29

AI赋能职场新图景：近半任务独立承担，人机协同成未来主流期盼

06-29

AI职场渗透加速：近半任务可独立承担，人机协同成未来新期待

06-29

股东会亮出“价值底牌”，长城汽车引领行业跳出“销量陷阱”

06-29

中国建材三条世界级高性能碳纤维产线投产，推动产业向高端技术化转型

06-29

端侧AI爆发智能驾驶跃迁 Chiplet赋能：我国SoC芯片行业迎来发展新机遇

06-29

图灵奖得主希发基思加盟曹操出行助力AI转型与自动驾驶技术突破

06-29

点击查看更多 +

全站最新

29.99万起！东风猛士M817上市，越野与智能融合开启新体验

2027款揽胜谍照来袭！纽北赛道测试，纯电版与多动力升级齐亮相

比亚迪全新品牌领汇汽车发力出行市场 M9商务旗舰MPV今日上市 18.88万元起售

标致全新纯电208谍照来袭！基于新平台打造，2027年交付续航超500km

2026技术岗新趋势：掌握AI工具，让就业竞争力飙升，告别失业焦虑

智算集群加速发展液冷赛道崛起依米康多领域布局引领行业新趋势

热门内容

本栏最新

股东会亮出“价值底牌”，长城汽车引领行业跳出“销量陷阱”

华为杨扬：借AI焕新产品服务携手各方推动Token经营价值提升

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

东风奕派M8正式开启预售！19.98万元起享大六座SUV与华为黑科技

AI浪潮来袭，通信行业如何借力重构模式，开启智能新篇章？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.