ITBear旗下自媒体矩阵:

DeepSeek新动向:MODEL1代码现端倪,新架构或融合最新成果2月将至?

   时间:2026-01-21 11:01:37 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,AI领域传来新动态,有消息指出DeepSeek或将在农历新年期间,也就是今年2月中旬,推出新一代旗舰AI模型DeepSeek V4,该模型在写代码能力方面将有显著提升。这一消息最初由The Information在月初爆料,引发了行业内的广泛关注。

1月20日,恰逢DeepSeek - R1发布一周年,开发者们在GitHub上有了新发现。DeepSeek更新了一系列FlashMLA代码,在横跨114个文件中,有28处都出现了未知的“MODEL1”大模型标识符。这一标识符与已知的现有模型“V32”(即DeepSeek - V3.2)在代码中被并列或区别提及,让开发者们敏锐地察觉到新模型的存在。

通过对代码上下文的深入分析,开发者们推测“MODEL1”很可能代表着一个与现有架构截然不同的新模型。在关键技术层面,“MODEL1”与“V32”存在明显区别。具体体现在键值(KV)缓存的布局、稀疏性处理方式以及对FP8数据格式的解码支持等方面。这些差异暗示着新架构可能在内存优化和计算效率上进行了专门的设计,有望带来更出色的性能表现。

值得一提的是,在前几天,DeepSeek研究团队还陆续发布了两篇技术论文。其中一篇介绍了名为“优化残差连接(mHC)”的新训练方法,另一篇则介绍了一种受生物学启发的“AI记忆模块(Engram)”。技术社区据此推测,正在开发中的新模型极有可能会整合这些最新的研究成果,从而进一步提升模型的综合能力。这一系列动作表明DeepSeek在AI领域的探索从未停止,不断推动着技术的进步与创新。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version