ITBear旗下自媒体矩阵:

DeepSeek V4发布:开源新势力崛起,国产AI生态持续进化

   时间:2026-04-24 19:28:51 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

备受瞩目的DeepSeek V4模型预览版近日正式发布,其权重同步开源,为人工智能领域注入新的活力。此次发布的版本包括旗舰版V4 PRO和经济型V4-Flash,前者总参数达1.6万亿,激活参数49B;后者总参数284B,激活参数13B。两者均支持100万token上下文,并采用MIT协议完全开源,展现了DeepSeek在技术开放上的坚定决心。

就在DeepSeek发布前一天,OpenAI上线了GPT-5.5,每百万输出token定价高达30美元。相比之下,DeepSeek V4-Flash的输出定价仅为2元人民币/百万token,折合不到0.3美元,形成了鲜明的价格对比。这一差异不仅体现了闭源与开源模型的不同定价逻辑,也引发了市场对两者性价比的广泛讨论。

DeepSeek V4的发布并非一帆风顺。从去年底到今年初,其发布窗口多次推迟,行业内外对此充满期待与猜测。在百万上下文已成为行业标配的背景下,DeepSeek V4通过引入全新的混合注意力架构,成功降低了处理超长文本时的算力消耗和KV缓存占用。据技术报告显示,V4-Pro在百万token上下文设置下,每处理一个token的算力消耗仅为V3.2的27%,KV缓存占用仅为10%,这一突破为长上下文应用的普及奠定了基础。

在模型矩阵方面,DeepSeek V4提供了旗舰版和经济型两种选择,并支持三种推理模式:非思考模式、思考模式-高和思考模式-极限。官方建议复杂Agent场景使用极限模式,以充分发挥模型的推理能力。内部员工已将V4-Pro作为日常Agentic Coding工具使用,其体验优于Claude Sonnet 4.5,交付质量接近Opus 4.6非思考模式,但在与Opus 4.6思考模式的对比中仍存在一定差距。这种直白的自我评价,体现了DeepSeek在技术自信与务实态度之间的平衡。

V4的API定价策略同样引人关注。V4-Flash的输入价为1元/百万token(缓存命中0.2元),输出价为2元;V4-Pro的输入价为12元/百万token(缓存命中1元),输出价为24元。官方表示,Pro版下半年算力扩容后将大幅下调价格。这一策略不仅降低了开发者的使用门槛,也通过缓存机制鼓励更高效的应用开发模式。对于Agent类应用而言,将固定内容放在请求头部以触发缓存机制,恰好是最典型的调用模式,这有助于进一步降低边际成本。

DeepSeek V4的核心定位是Agent底座,而非直接参与应用生态竞争。官方明确表示,V4针对Claude Code、OpenClaw等主流Agent产品进行了专项适配和优化,在Agentic Coding评测中达到开源模型最佳水平。这一选择与当前行业格局密切相关:Anthropic的年化收入快速增长,Cursor等代码编辑器估值飙升,应用层的利润空间巨大。然而,DeepSeek选择成为Agent时代的基础设施供应商,通过长上下文、低价API和Agent适配的组合,为开发者提供更高效的工具。

在国产开源大模型领域,竞争日益激烈。今年以来,阿里Qwen3.5、智谱GLM-5、Kimi K2.6等模型相继发布,在参数规模、API定价和性能评测等方面展开角逐。例如,Qwen3.5总参数3970亿,激活仅170亿,百万token的API价低至0.8元;Kimi K2.6在SWE-Bench Verified上拿到80.2%的评分,几乎追平Claude Opus 4.6。这些进展表明,国产模型在国际开发者社区的影响力正在持续提升。

算力层面的匹配同样关键。华为在V4发布当日确认,昇腾全系列产品已全面适配V4-Flash和V4-Pro。基于昇腾950超节点,V4-Pro在8K输入场景下实现了约20ms的单token解码时延,单卡吞吐4700 TPS;V4-Flash可以做到约10ms时延,单卡吞吐1600 TPS。这些数据背后,是昇腾950在底层架构上的多项升级,包括原生支持低精度格式、针对MoE稀疏访存特征的优化等。华为还开源了PyPTO编程范式,缩短了复杂算子的开发周期,进一步降低了开发门槛。

寒武纪也在发布当天宣布,已基于vLLM框架完成V4-Flash和V4-Pro的适配,代码同步开源到GitHub。两家国产芯片厂商的快速响应,体现了模型研发与算力适配的深度协同。据此前报道,DeepSeek团队为完成从CUDA生态到昇腾CANN框架的技术栈迁移,重写了大量核心代码,这也是V4多次跳票的原因之一。然而,这一努力使得万亿参数级的开源旗舰模型在发布首日就能跑在国产算力上,其意义已超越单一模型的评测范畴。

从DeepSeek R1发布引发美股震荡,到V4的持续在场,中国AI研发正逐步摆脱“偶尔令人震撼”的标签,进入“系统性创新”的新阶段。无论是模型性能的突破,还是算力生态的完善,都表明中国AI已具备连续性创新的能力。这种能力不仅体现在技术层面,更体现在开发者社区的活跃度和产业链的协同效率上。随着更多国产模型和算力方案的涌现,中国AI正在全球舞台上扮演越来越重要的角色。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version