滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek V4技术规格提前曝光：1.6万亿参数+1M上下文，下周能否上线引期待

时间：2026-04-24 00:24:46 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近期，国产AI大模型领域竞争愈发激烈，各大厂商纷纷推出新品或进行版本升级，而备受瞩目的DeepSeek V4却迟迟未正式亮相，引发了行业内外的广泛关注与期待。外界普遍猜测，DeepSeek V4将凭借一系列创新技术，助力国产AI大模型在国际舞台上占据一席之地，即便无法登顶，也至少应具备与闭源顶级AI相抗衡的实力。

据普林斯顿大学博士生Yifan Zhang在社交平台X上披露的信息，DeepSeek V4将推出两个版本，分别为完整版和Lite版。其中，完整版参数量高达1.6万亿，Lite版参数量则为2850亿，这一规格与此前流传的传闻基本吻合。

在技术架构方面，DeepSeek V4在注意力机制上进行了重大创新，采用了DSA2技术。该技术融合了DeepSeek V3/R1中的DSA机制，以及今年初DeepSeek论文中提出的NSA稀疏注意力机制，旨在提升模型的计算效率和性能表现。

MoE混合专家技术方面，DeepSeek V4采用了融合方案，配备Mega内核，每层设置384个专家，每次激活6个专家。这种设计有助于模型在处理复杂任务时，能够更灵活地调用不同的专家模块，提高整体的处理能力。

残差连接方面，DeepSeek V4采用了此前论文中提出的Hyper-Connections技术。该技术在DeepGemm的更新中也有所提及，有助于模型在训练过程中更好地保留和传递信息，提升模型的稳定性和准确性。

在后端训练及优化方面，DeepSeek V4同样引入了多项新技术。优化器采用了Muon，RL强化学习则使用了GRPO及KL散度修正方法。通过这些技术的应用，DeepSeek V4成功将预训练的32K上下文扩展到了1M上下文，显著提升了模型的处理能力和应用范围。

值得注意的是，尽管此前DeepSeek的更新中曾暗示V4将支持视觉功能，实现多模态处理，但此次爆料却称DeepSeek V4依然是一个纯文本大模型，这一消息多少有些出乎意料。

然而，对于这份爆料内容的真实性，目前尚无法完全确认。由于爆料者并非DeepSeek公司的研发人员，其介绍的技术细节更像是综合了网上的相关资料。事实上，许多细节此前已在网上有过爆料或官方资料中露出端倪，但缺乏官方确认，因此仍存在不确定性。

回顾DeepSeek的发展历程，R1版本发布至今已过去15个月，距离V3.2最终版也已过去5个月。在这段时间里，其他大模型公司至少完成了一代大版本和两三个小版本的迭代升级。因此，DeepSeek V4面临的竞争压力不容小觑，发布时间的推迟也使其面临更大的市场挑战。

更多>同类资讯

孙周兴复旦演讲：探寻AI无法触及之地，不可数字化哥德尔信息成关键

07-02

国产算力新突破！海光信息携手同济大学，AI4E千卡集群助力工程智能升级

【环球网科技报道记者李文瑶】6月25日，上海同济大学，海光信息与同济大学正式签署战略合作协议，挂牌成立全国首个“高校海光算力优化中心”，共建国内首个国产千卡工科智算集群。此次千卡集群的落地，不仅填补了…

07-02

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

07-02

优必选CEO预测：未来机器人将主导工作，20余款超仿生人形机器人亮相

07-02

米哈游于上海新设舒俱科技公司注册资本千万聚焦多领域开发

07-02

松下押注AI领域！官宣5000亿日元投资，目标AI基建销售额达1.4万亿日元

07-02

Figure 03进驻宝马工厂：以创新技术解锁物流新场景，赋能汽车生产新未来

07-02

优必选发布全球首款全尺寸超仿生人形机器人U1系列盘中股价涨超17%

上证报中国证券网讯（记者何治民杨子晏）6月30日午后，优必选震荡拉升，截至14时22分，该股涨17.51%，报112.4港元/股。消息面上，6月30日下午，优必选发布全球首款全尺寸超仿生人形机器人U1系…

07-02

英伟达中国大规模招揽机器人人才，具身智能领域高薪“抢人”进行时

具身智能团队开放岗位最多，共6个职位；仿真方向开放4个岗位；部署方向同样设4个岗位；解决方案架构方向设2个岗位，负责向各行业输出英伟达技术方案。目标是打造机器人领域的安卓生态，覆盖工业机械臂、四足与人形机器…

07-02

超仿生人形机器人：99%的完美背后，那1%的人性为何无法复制？

跟进厂干活的工业级人形机器人不一样，它走的是情感陪伴赛道：但那时候，它就是个完美恋人了吗？机器人越像人，越暴露它永远缺的那1%。但它永远无法拥有鲜活的人性。现在的工业制造、AI 算法、精密加工，已经强大…

07-02

99万“天价”陪伴机器人引热议，优必选冲刺万亿家庭市场胜算几何？

最近，2个“万亿”引起市场的关注，一个是寒武纪市值突破万亿，另一个是“人形机器人第一股”优必选发布的陪伴机器人新品，想要冲刺万亿超仿生机器人市场。面向未来的万亿市场，优世界U1进行了一次探索，1.3万的订单…

07-02

优必选周剑谈人形机器人：家庭场景潜力大，当下聚焦情感陪伴正当时

如果一定要分的话，我觉得50%的精力在商业和工业，还有50%是在家庭，我们三条腿都在做。这也让我看到一个机会，中国无论在AI、物理世界构建、数据场景，还是本体制造，我们有些公司量产了几千台上万台，而海外公司…

07-02

博雷顿智驾大模型亮相新疆 “算电双驱”引领矿山智能化新变革

业内人士表示，智驾大模型的发布，意味着博雷顿正在推动矿山无人驾驶从规则驱动走向模型驱动，从单车智能走向车队协同，从人工经验走向数据决策，从局部优化走向全局优化。业内人士认为，这场发布会标志着博雷顿正在把多…

07-02

机器人“求学”进阶路：从训练到“高考”，具身智能开启新篇章

之前各家机器人公司在各自摸索怎么造，现在工信部定下的这套标准，相当于给全行业发了一张统一的“课程表”和“考试大纲”。今后会有更多的机器人需要经历“高考”，而这场考试的意义，是为了在不久的将来，让通过正规考试的…

07-02

OceanBase湖库一体，重新定义AI数据库

07-02

点击查看更多 +

全站最新

2026年三款AI智能降噪助听器深度测评：精准匹配需求，开启清晰聆听新体验

全新一代天工08预售开启！17.98万起，家庭高品质纯电生活轻松享

鑫源向上V6：小众品牌打造刚需神车，能否在巨头夹击中突围？

新款红旗天工08 670 Max预售开启限时优惠+多项权益智能豪华新选择

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

热门内容

本栏最新

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

岚图泰山X8纯电版7月交付，配置拉满，30万级SUV市场激战将启

iCAR V27首轮大规模OTA升级来袭智能驾驶等140余项功能焕新升级

iCAR V27首轮大规模OTA升级来袭智能驾驶安全座舱全面焕新升级

缤果PRO上市月余车主反馈：好看好开又实用，城市代步新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.