DeepSeek V4发布：开源新势力崛起，国产AI生态持续进化

时间：2026-04-24 19:28:51 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

备受瞩目的DeepSeek V4模型预览版近日正式发布，其权重同步开源，为人工智能领域注入新的活力。此次发布的版本包括旗舰版V4 PRO和经济型V4-Flash，前者总参数达1.6万亿，激活参数49B；后者总参数284B，激活参数13B。两者均支持100万token上下文，并采用MIT协议完全开源，展现了DeepSeek在技术开放上的坚定决心。

就在DeepSeek发布前一天，OpenAI上线了GPT-5.5，每百万输出token定价高达30美元。相比之下，DeepSeek V4-Flash的输出定价仅为2元人民币/百万token，折合不到0.3美元，形成了鲜明的价格对比。这一差异不仅体现了闭源与开源模型的不同定价逻辑，也引发了市场对两者性价比的广泛讨论。

DeepSeek V4的发布并非一帆风顺。从去年底到今年初，其发布窗口多次推迟，行业内外对此充满期待与猜测。在百万上下文已成为行业标配的背景下，DeepSeek V4通过引入全新的混合注意力架构，成功降低了处理超长文本时的算力消耗和KV缓存占用。据技术报告显示，V4-Pro在百万token上下文设置下，每处理一个token的算力消耗仅为V3.2的27%，KV缓存占用仅为10%，这一突破为长上下文应用的普及奠定了基础。

在模型矩阵方面，DeepSeek V4提供了旗舰版和经济型两种选择，并支持三种推理模式：非思考模式、思考模式-高和思考模式-极限。官方建议复杂Agent场景使用极限模式，以充分发挥模型的推理能力。内部员工已将V4-Pro作为日常Agentic Coding工具使用，其体验优于Claude Sonnet 4.5，交付质量接近Opus 4.6非思考模式，但在与Opus 4.6思考模式的对比中仍存在一定差距。这种直白的自我评价，体现了DeepSeek在技术自信与务实态度之间的平衡。

V4的API定价策略同样引人关注。V4-Flash的输入价为1元/百万token（缓存命中0.2元），输出价为2元；V4-Pro的输入价为12元/百万token（缓存命中1元），输出价为24元。官方表示，Pro版下半年算力扩容后将大幅下调价格。这一策略不仅降低了开发者的使用门槛，也通过缓存机制鼓励更高效的应用开发模式。对于Agent类应用而言，将固定内容放在请求头部以触发缓存机制，恰好是最典型的调用模式，这有助于进一步降低边际成本。

DeepSeek V4的核心定位是Agent底座，而非直接参与应用生态竞争。官方明确表示，V4针对Claude Code、OpenClaw等主流Agent产品进行了专项适配和优化，在Agentic Coding评测中达到开源模型最佳水平。这一选择与当前行业格局密切相关：Anthropic的年化收入快速增长，Cursor等代码编辑器估值飙升，应用层的利润空间巨大。然而，DeepSeek选择成为Agent时代的基础设施供应商，通过长上下文、低价API和Agent适配的组合，为开发者提供更高效的工具。

在国产开源大模型领域，竞争日益激烈。今年以来，阿里Qwen3.5、智谱GLM-5、Kimi K2.6等模型相继发布，在参数规模、API定价和性能评测等方面展开角逐。例如，Qwen3.5总参数3970亿，激活仅170亿，百万token的API价低至0.8元；Kimi K2.6在SWE-Bench Verified上拿到80.2%的评分，几乎追平Claude Opus 4.6。这些进展表明，国产模型在国际开发者社区的影响力正在持续提升。

算力层面的匹配同样关键。华为在V4发布当日确认，昇腾全系列产品已全面适配V4-Flash和V4-Pro。基于昇腾950超节点，V4-Pro在8K输入场景下实现了约20ms的单token解码时延，单卡吞吐4700 TPS；V4-Flash可以做到约10ms时延，单卡吞吐1600 TPS。这些数据背后，是昇腾950在底层架构上的多项升级，包括原生支持低精度格式、针对MoE稀疏访存特征的优化等。华为还开源了PyPTO编程范式，缩短了复杂算子的开发周期，进一步降低了开发门槛。

寒武纪也在发布当天宣布，已基于vLLM框架完成V4-Flash和V4-Pro的适配，代码同步开源到GitHub。两家国产芯片厂商的快速响应，体现了模型研发与算力适配的深度协同。据此前报道，DeepSeek团队为完成从CUDA生态到昇腾CANN框架的技术栈迁移，重写了大量核心代码，这也是V4多次跳票的原因之一。然而，这一努力使得万亿参数级的开源旗舰模型在发布首日就能跑在国产算力上，其意义已超越单一模型的评测范畴。

从DeepSeek R1发布引发美股震荡，到V4的持续在场，中国AI研发正逐步摆脱“偶尔令人震撼”的标签，进入“系统性创新”的新阶段。无论是模型性能的突破，还是算力生态的完善，都表明中国AI已具备连续性创新的能力。这种能力不仅体现在技术层面，更体现在开发者社区的活跃度和产业链的协同效率上。随着更多国产模型和算力方案的涌现，中国AI正在全球舞台上扮演越来越重要的角色。

其降价的核心技术基础是，小米MiMo大模型团队围绕Hybrid SWA+MoE+多模态的复合架构，系统性重构从KV Cache管理、分级缓存、前缀缓存到调度策略与Prefill/Decode链路的完整推理栈…

在Token智能守护方面，华为秉持“AI对抗AI、AI守护AI”理念，推出内置AI Core引擎的AI防火墙，未知病毒检出率达95%；同时打造Agent安全护栏，结合鲲鹏架构与算子多层优化，实现安全和效率…

像深圳市小家居用品有限公司，具备 17 年水杯制造经验，这使得他们在生产工艺、质量把控等方面都有深厚的积累，能够确保产品的稳定性和可靠性。小米水杯代工专业厂家在这个行业中扮演着重要角色，通过专业的生产和定制服…

这是继4月交付量超3万辆后，小米汽车连续第二个月站上3万台交付台阶。截至4月30日，YU7上市10个月累计交付23.2万台。最新用户数据显示，小米YU7的车主中，超过1/3为女性车主，超过一半是苹果用户。5月…

这一成绩不仅巩固了其在新能源汽车市场的地位，更让行业内外对其未来发展充满期待。雷军甚至提到，团队曾多次统计出具体的交付数字，比如36700台，但他认为没有必要过于关注这些细节，统一报告为3万台就可以。随着电动…

交付数据：稳步增长小米汽车4月、5月交付量均突破3万台，延续增长势头。2月、3月交付量已超2万台，初期爬坡速度显著。官方称销量增长超预期。雷军回应：避免数字竞争雷军解释不公布精确销量是为了避免与同行陷入“比拼…

交付仪式盛况小米YU7GT正式开启交付，雷军与舒淇现身交付仪式，首批车主对新车赞不绝口。“人-车-家”生态互联车主可通过YU7GT控制米家设备，实现生态无缝连接。外观与性能车厘子红配色受好评，车漆工艺精湛。旅…

小米汽车路测的核心困难集中在**极端环境、智驾短板、公共路测争议、高强度投入压力**四大方面：###一、极端环境“三高”测试挑战-**高温（吐鲁番）**：室外45–50℃，车内温度可达60–70℃，考验电池热…

6月1日消息，继4月交付量站稳三万台阶之后，刚刚过去的5月份，小米汽车的单月交付成绩依旧超过3万台，市场表现持续向好。小米汽车官方今天正式对外披露相关数据，2026年5月，品牌单月交付量持续站稳三万台阶，连续…

无论是调节家中的灯光、空调，还是查看家庭安防，车主都能在驾驶过程中轻松实现，充分展现了小米在智能生态系统整合方面的强大能力。这一优势不仅吸引了众多消费者的目光，也成为他们选择小米YU7GT的重要原因。许多车主…

6月1日，盖世汽车获悉，小米汽车正式披露2026年5月交付数据：当月交付量持续超过30,000台，连续第二个月守稳“三万+”关口。此前4月，小米汽车刚刚以超30,000台的成绩完成从Q1低谷期的爬坡回归，5月…

在产业链整合、硬件集成方面，科大讯飞也已在录音笔、学习机、翻译机等多样化智能硬件产品的布局过程中积累了丰富产业经验。舜宇光学科技在全球光学行业占据绝对领先地位，是具备波导镜片、微型显示与传感模组、整机工业设…

智通财经获悉，国盛证券发布研报称，看好百度集团-SW(09888)“芯云模体”的全栈式AI布局以及昆仑芯的放量，预计公司2026-2028收入为1323/1443/1596亿元;n0n-GAAP归母净利173…

每经AI快讯，6月1日，石头科技公告称，公司第三届董事会第十七次会议审议通过以集中竞价交易方式回购公司股份的议案。公司拟以自有资金回购已发行的部分A股，回购价不超179.86元/股，回购资金3亿元~4亿元。回…

6月1日，石头科技（688169）发布公告，计划以集中竞价交易方式回购股份，回购资金总额不低于3亿元且不超过4亿元，回购价格上限为179.86元/股，预计回购股份数量为167万股至222万股，占总股本的0.6…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.