滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek V4虽未集成Engram，但其理念已为下一代模型铺就新路

时间：2026-05-03 16:17:39 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当DeepSeekV4的技术报告公布时，人工智能领域的研究者们迅速展开了对其中各项技术的讨论。mHC、CSA、HCA、Muon、FP4等新概念引发了广泛关注，但一个曾被寄予厚望的模块——Engram却意外缺席。这一情况立即成为社交媒体和学术论坛上的热门话题，许多人开始追问：Engram究竟去了哪里？

Engram并非凭空出现。今年早些时候，DeepSeek与北京大学联合开源了这项技术，其核心目标是解决大型语言模型在记忆与效率方面的瓶颈。传统模型在处理"伦敦是英国首都"这类简单事实时，往往需要调动整个深层网络进行重复计算，而Engram的设计允许模型直接查询预存知识，既节省了显存资源，又释放了网络容量用于更复杂的推理任务。

这项技术自公布以来就备受期待。研究人员普遍认为，Engram很可能会成为DeepSeekV4的架构基础。当V4正式发布后，众多开发者第一时间在论文中搜索Engram关键词，结果却令人失望——这个模块并未出现在最终版本中。这种反差引发了更多讨论，甚至有网友直言没有Engram的V4是不完整的。

尽管未能出现在V4中，Engram的技术理念并未消失。短短三个月内，至少有三个重要研究项目延续了这条技术路线。第一个项目来自北京大学等机构组成的联合团队，他们探索了将Engram模块部署在CXL内存池中的可行性。通过构建多机共享的4TB内存池，研究证实这种架构能够有效支持千亿级参数的Engram表，同时保持较低的端到端吞吐损耗。

第二个值得关注的研究来自独立研究者TaoLin。他针对Engram的多头哈希查表机制提出了一个看似合理的优化方案：使用最小完美哈希函数消除查表冲突。然而实验结果却出人意料——在严格控制参数量的测试中，这种无冲突设计并未带来预期的性能提升，反而显示出训练后期多头哈希机制具有独特优势。这个发现挑战了研究者的直觉认知。

第三个突破发生在跨模态应用领域。开源团队AutoArk成功将文本版的Engram移植到视觉模型Stable Diffusion上。他们设计了分层编码机制，使视觉补丁能够像文本token一样进行哈希查询。对比实验显示，在相同效果下Engram所需的额外参数仅为LoRA方法的15%-30%，且在连续注入多个新概念时表现出更强的稳定性。这项工作证明了Engram架构在非文本领域的潜在价值。

原Engram论文的作者团队至今未对V4的缺席作出公开解释。其代码仓库的最后更新停留在今年1月中旬，保持开源状态但未新增功能。值得注意的是，论文摘要中曾明确指出："条件记忆将成为下一代稀疏模型不可或缺的建模原语"。这种表述让外界猜测，或许要等到V5甚至V4.1版本，才能看到Engram技术的完整实现。

目前，学术界对Engram的探索仍在继续。有研究者正在尝试将其与混合专家系统（MoE）进行更深度的整合，另有团队在探索更高效的索引压缩算法。这些工作共同描绘出一个技术演进图景：虽然核心发明者暂时保持沉默，但整个社区正在从不同角度推动这项技术走向成熟。

05-03

从“中文税”到古文省Token：AI分词器背后中文适配的曲折之路

05-03

Engram缺席DeepSeek V4：遗憾背后是理念延续与多领域探索的新可能

05-03

蔚来CEO李斌：今年车卖不好公司就没了

05-03

百亿公司高管们为何集体转身，去Anthropic当工程师

05-03

蔚来CEO李斌：今年车卖不好公司就没了

05-03

伯克希尔年会聚焦AI：务实布局不盲目，高管称其难替人类决策

05-03

格雷格·阿贝尔首秀主持，巴菲特台下就座，“后巴菲特时代”股东大会亮点速览

05-03

自动化焊接机器人：2026年技术升级如何重塑制造业竞争力格局

05-03

五一文旅新体验：AI赋能沉浸游科技助力文化传承新路径

05-03

荣耀与ARRI阿莱合作背后：同期有手机厂商竞争，延期或为带来更优体验

05-03

GAIR Live圆桌：端云协同与记忆工程如何破解AI Agent的Token焦虑？

05-03

苹果iPhone 18 Pro系列或采用激进定价基本款价格有望维持稳定

05-03

AI浪潮下人类工作何去何从？掌握这项能力方能稳立时代潮头

05-03

荣耀与ARRI阿莱牵手背后：同期有手机厂商竞争，荣耀凭实力胜出

05-03

点击查看更多 +

全站最新

冯柳逆势加仓这家公司！邓晓峰最新持仓来了

图解4月、1-4月ETF资金流榜单

时隔四年重磅回归！小米MIX5或2026年亮相，真全面屏+磁吸镜头+自研芯

小红书剑指电商新赛道，“好物市场”能否打造唯品会式商业新版图？

Meta收购机器人公司ARI，发力具身智能欲做人形机器人底层生态赢家

科大讯飞AI学习机T30 Ultra：个性化学习+护眼设计，开启高效学习新体验

热门内容

本栏最新

2026北京车展吉利大放异彩：新概念车、新架构、新技术引领智电新潮流

东风日产N7黑骑士北京车展登场！轿跑设计+635km续航，主打年轻运动市场

吉利中国星i-HEV智擎混动登场：中国品牌重塑全球混动技术新秩序

2026北京车展：独立供应商崛起，智能汽车技术变革与全球化新征程

奥迪E7X 5月8日开启预售！大空间强驾控，40万级电动SUV新选择

奥迪E7X 5月8日开启预售！大五座纯电SUV，驾控智舱双在线

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.