滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

MusubiAI的Mela模型：模拟大脑记忆机制，让AI突破长文本处理瓶颈

时间：2026-05-16 20:27:04 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能语言模型领域，一项突破性研究正引发广泛关注。由独立研究团队开发的Mela模型，通过借鉴人类大脑记忆巩固机制，成功解决了传统模型处理长文本时的计算瓶颈问题。该模型在保持较小训练窗口的同时，展现出处理超长文本的卓越能力，为AI语言处理开辟了新路径。

传统Transformer架构存在根本性缺陷：其注意力机制需要同时处理全部历史信息，导致计算复杂度随文本长度呈平方级增长。当输入超过4096个词元时，模型性能会急剧下降。这种限制使得现有AI在处理长文档、持续对话等场景时表现不佳，成为制约技术落地的关键障碍。

研究团队从神经科学领域获得灵感，将记忆巩固理论转化为工程实现。转化假说认为，人类记忆不是简单转移存储位置，而是通过提炼具体情节形成抽象知识。基于这一理论，Mela构建了分层记忆模块（HMM），包含快速更新的低层模块（L模块）和慢速整合的高层模块（H模块），分别模拟海马体和大脑皮层的功能。

HMM的核心创新在于"分层潜递归"机制。L模块以高频节奏处理输入文本，保留详细情节信息；H模块则定期整合L模块的输出，提炼出语义层面的模式。这种快慢结合的更新方式，既避免了全局注意力机制的高计算成本，又防止了简单状态压缩导致的信息丢失。研究特别引入神经记忆层，通过"惊讶程度决定学习强度"的机制，使模型能动态调整记忆更新速度。

在技术实现上，Mela采用多重优化策略。记忆更新规则引入遗忘因子和动量参数，防止模型因极端输入陷入混乱；Newton-Schulz正交化技巧确保梯度更新方向独立，使困惑度降低0.21点。最终记忆输出通过两层MLP融合情节记忆和语义记忆，这种非线性变换方式比简单加权平均更有效，消融实验证实其能根据上下文动态调整记忆权重。

实验数据显示显著优势。在4096词元训练窗口下，4亿参数规模的Mela困惑度为12.01，优于同等规模Transformer++的12.56。当测试长度扩展至32768词元时，Mela困惑度仅升至14.50，而Transformer++飙升至303.56。这种差距在8亿和12亿参数规模模型中同样存在，证明Mela的架构优势具有普适性。

深入分析揭示关键设计选择的价值。增加H循环次数可显著提升长文本处理能力，8192词元时H=4比H=2困惑度低0.33点。L循环次数则呈现非线性影响，两轮循环因信息滞后反而降低性能。模块深度实验显示，L模块加深对短文本帮助更大，H模块加深则显著提升长文本表现，验证了不同记忆层次的功能分工。

该研究最引人注目的创新是MemStack技术。通过将HMM递归过程中的中间记忆状态注入解码器不同层级，使模型能同时访问不同抽象层次的记忆痕迹。这种设计使困惑度进一步降低0.1点，且不增加计算开销。实验表明，模型在处理超出训练长度的文本时，能通过记忆状态有效传递跨片段信息，而非依赖局部注意力机制。

这项工作为AI架构设计提供了新范式。通过将神经科学原理转化为可计算的工程模块，研究团队证明了跨学科融合的价值。虽然目前仅在语言建模任务上验证效果，但其处理长程依赖的能力，对代码生成、多轮对话等需要保持上下文连贯性的应用具有潜在价值。随着模型规模扩大和数据增长，架构创新将成为突破性能瓶颈的关键方向。

更多>同类资讯

理想汽车发布全新一代L9，具身智能加持，首销期优惠配置升级齐登场

05-16

比亚迪腾势迎里程碑时刻！第50万台车N9闪充版下线 5月18日上市

05-16

AI助力科研新突破：我国团队成功制备超200微米高质量单晶石墨

05-16

吉林低空经济“破壁”腾飞：从空域开放到产业崛起的新征程

05-16

海光DCU赋能能源电力AI研发：20余方向获高性能算力与全流程服务支持

05-16

海光信息携手中电联，以“算电协同”赋能能源电力AI研发新征程

05-16

南京大学团队突破：无芯片无电池激光操控软体机器人开启新交互时代

05-16

众擎机器人战略投资飞阔科技，共启人形机器人全链路协同新征程

05-16

陶哲轩宣布改变工作习惯：AI时代数学规则重塑，理解力成新赛点

05-16

杭州挂牌启用国家人工智能中试基地具身智能机器人开启现实应用新篇章

05-16

蔚来秦力洪解读神玑NX9031：四大硬核标准定义先进车载芯片新标杆

05-16

词元计价：开启全球算力服务新流通时代的关键钥匙

05-16

宁波“毫秒竞赛”新探索：多元能源协同如何筑牢算力绿色底座

05-16

远望新能源基金布局结硕果 “电建一号”卫星发射开启商业航天新征程

05-16

NASA新一代太空芯片问世：性能飙升500倍，助力深空探测与星际探索

05-16

点击查看更多 +

全站最新

光梭未来成胜惠亮相搜狐科技论坛：以科技为翼引领新能源重卡迈向智能新纪元

人保财险重庆分公司：以创新实干之姿，筑牢低空经济“安全防护网”

谷歌DeepMind与港大联合研究：字节级语言模型实现高效高质量新突破

油电双线发力！吉利4月销量成绩亮眼，新能源燃油市场齐头并进展实力

小米YU7 GT赛道红内饰曝光：红黑交织配专属刺绣，高性能轿跑SUV月底见

小米YU7 GT未上市先受热捧，媒体试驾赛车手齐点赞，到店体验别错过

热门内容

本栏最新

比亚迪腾势品牌迎里程碑第50万台车N9闪充版下线 5月18日将上市

10-15万级插混家轿新选择！吉利银河星耀7这些亮点能否打动你？

一季度数字产业开局良好：收入利润双增，互联网业务与算力基建齐头并进

AI赋能智联全球：华为HMS for Car升级助力车企扬帆出海

全新理想L9上市：配置升级定价策略转变，九系大战序幕拉开

比亚迪大唐EV武汉首秀：东方美学邂逅硬核科技开启纯电出行新纪元

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.