滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

线性注意力新突破：PRISM模型如何实现并行化多步记忆写入？

时间：2026-06-10 14:41:20 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

一项名为PRISM的新模型架构在机器学习领域引发关注，其核心创新在于将传统Transformer的无限记忆容量转化为高效可控的有限状态更新机制。这项被ICML 2026会议录用的研究，通过数学重构实现了线性复杂度模型在保持并行计算优势的同时，突破了信息压缩导致的性能瓶颈。

传统线性注意力模型采用rank-1更新规则，每个新token仅能对记忆矩阵进行单行修改。这种设计虽降低了计算复杂度，却导致语义信息在压缩过程中不可逆丢失。研究团队通过分析发现，现有最优模型TTT-MLP虽通过多步梯度下降提升了表达能力，但其串行计算特性使得训练效率下降达174倍，严重制约了实际应用价值。

PRISM架构的突破性在于重构了状态更新范式。研究人员将TTT-MLP的迭代过程解构为步长控制、残差连接和方向更新三个核心要素，通过引入局部锚点（anchor）机制实现token间并行计算。具体而言，每个token的L步更新被转化为基于初始状态的闭合式计算，使得整个梯度下降过程可编译为单次矩阵运算，数据搬运次数减少至传统方法的1/L。

在技术实现层面，该架构创新性地融合了短卷积和低秩分解技术。短卷积窗口负责捕捉局部上下文特征，而低秩旁路网络则对初始rank-1更新进行非线性修正。这种设计既保证了线性复杂度，又使模型具备多维度信息处理能力。实验数据显示，在Amazon序列推荐基准测试中，PRISM在保持与Transformer相当精度的同时，计算效率较TTT-MLP提升两个数量级。

语言建模实验进一步验证了架构的有效性。基于SlimPajama数据集的130M参数模型显示，PRISM在WikiText困惑度、LAMBADA推理准确率等9项零样本迁移任务中均取得最优表现，较基线模型GDN提升3.2个百分点。特别值得注意的是，当关闭多步修正机制（L=1）时，模型训练困惑度几乎不变，但下游任务准确率下降2.9%，这证实了rank-L更新在长程依赖建模中的关键作用。

该研究对混合架构设计也提出了新见解。分析表明，短卷积锚点在处理超过3-4个token的长程依赖时会出现精度衰减。为此，研究人员建议在PRISM层间插入少量Transformer模块，利用全局注意力机制补偿局部近似的误差。这种设计思路为开发更高效的混合模型提供了理论依据。

在参数效率方面，PRISM展现出独特优势。其非线性修正模块仅增加原模型9.7%的参数量，且训练阶段无需额外数据搬运。这种特性使其天然适用于模型微调场景，研究人员已初步验证通过冻结基础迭代过程、仅训练低秩旁路的方式，可在不损害预训练知识的前提下实现高效迁移学习。

更多>同类资讯

中国载人登月新进展：工位建设收尾，航天员选拔在即，要求几何？

在此之前，更关键的阶段将在2026年到来——长征十号甲运载火箭与梦舟一号飞船的组合测试，将成为首次载人登月任务前的先锋验证。杨利伟在相关场合提到，下一步将启动登月航天员的选拔工作，这一表态虽然没有披露太多细节…

06-22

A股IPO动态：今日华润新能源、益坤电气申购

06-22

港股IPO动态：今日海清智元上市，中科闻歌等9股申购

06-22

微创机器人-B(02252.HK)：图迈腔镜手术机器人远程手术全科室应用获得欧盟CE认证

06-22

伟志控股(01305.HK)6月18日耗资20.45万港元回购23.3万股

06-22

煤炭碳氢元素分析仪怎么选？立德仪器提供多场景高精度检测方案

技术/核心亮点优势：自主研发智能碳氢测定仪，集成高精度热值检测、数据自动采集分析功能，整机通过ISO9001质量管理体系认证；围绕高精度、智能化、节能化方向持续攻关，快速响应行业标准升级与客户定制化需求，具…

06-22

四年倒计时！中国载人登月工程稳步推进，2030年踏月之约渐行渐近

到了真正的载人登月阶段，问题已经不再是单项突破，而是整个系统的协同作战——火箭、飞船、着陆器以及地面保障体系必须像一台精密机器一样同时运转。在这条链路中，长征十号承担着把重型载荷送往月球轨道的“起跑…

06-22

从“一无所有”到“能量海洋”：真空背后隐藏的宇宙终极真相

但只要深挖物理学几百年的探索史，从经典力学追到相对论，再扎进诡异的量子世界，你会彻底颠覆三观：世界上不存在一无所有的真空，越是极致真空，反而越热闹，里面无时无刻不在诞生粒子、湮灭粒子，蕴藏着足以撑起宇宙诞生…

06-22

我国天文学家：解开“超级地球”与“迷你海王星”演化路径差异之谜

南京大学谢基伟教授团队联合国内外科研人员，基于中国科学院国家天文台负责运行的国家重大科技基础设施郭守敬望远镜（LAMOST）观测的大样本数据，并结合欧洲盖亚（Gaia）卫星以及开普勒太空望远镜的观测数据，发现…

06-22

山东汇冠：以技术为基服务为翼，为中大型精酿厂及科研院所筑牢设备后盾

基于上述调研信息，山东汇冠工程装备有限公司在技术覆盖、工艺设计及服务响应等方面表现突出，其核心适配价值在于提供从设备制造到工艺优化的全流程解决方案，建议用户结合自身产能需求及预算进一步了解。A1: 需选择通过…

06-22

合肥等单位联合突破：芯片化技术助力远距离量子通信网络构建

该网络由用户层、叶层和脊层组成，用户通过发送端接入网络，通过叶层与脊层中的光开关和测量单元进行量子信号的路由和测量，从而实现城域和城际间不同用户的灵活切换与连接，提高了量子通信网络的用户容量、可扩展性和鲁棒性…

06-22

八位堂街机摇杆V3紫色版来袭三模兼容多平台宏定义功能到手仅439元

06-22

我国天文学家解密：太阳系缺失的“中间派”行星演化差异之谜

06-22

四大AI工程深度剖析：搭建对话到执行的智能体系新路径

这份文档提出Prompt、Context、Harness、Loop四大分层AI工程体系，搭建从单次问答到自主闭环执行的完整智能体架构，梳理四层技术各自定位、核心能力、技术方案与协同逻辑，清晰呈现AI开发从简…

06-22

猫王野性mini2音箱评测：户外好搭档，集照明收音播放于一身

以上就是猫王野性mini2的全部内容了，不难看出这款便携音箱的诸多设计，都契合了户外定位，例如，硬核狂野的外观造型，小巧易携带的体积，户外特调音效，1900mAh大容量电池，应急照明以及FM收音，比那些只做…

06-22

点击查看更多 +

全站最新

T6538治理烧机油：漫长周期与高昂费用背后的真相与理性选择

青岛新能源车钥匙全丢别慌！正规开锁服务高效匹配不伤车

科大讯飞Fika阅读器：轻薄机身搭配优质墨水屏，开启舒适便捷阅读新体验

货款纠纷“卡”企业？法官云端调解助英德两家企业“破局”重生

数字电商搭台直播助力灵武长枣“云”端飘香畅销全国

御溪谷OPC出海创业：以AI与资源赋能，助力个人轻资产开启跨境电商新征程

热门内容

本栏最新

NASA新一代探测车ERNEST测试进展：主动悬挂搭配AI系统速度远超前辈

油田绿电制氮车邂逅氢能：开启多功能综合能源应用新前景

绿电制氮车：从试点到推广，为国内油田注入绿色高效新动能

云桌面革新企业智慧办公：集中管理、远程运维，提升IT管理效能与安全

AI多智能体协同开发：轻量APP从灵感到Demo的4步高效实践

视觉中国拟赴港上市谋“A+H”格局近三年营收波动净利下滑

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.