国产大模型DeepSeek近日正式推出新一代DeepSeek-V4系列,凭借百万字级超长上下文处理能力、开源领先的Agent技术架构以及媲美国际顶尖闭源模型的推理性能,迅速引发AI产业与资本市场的双重关注。该系列包含高性能版DeepSeek-V4-Pro与高性价比版DeepSeek-V4-Flash,分别搭载1.6万亿总参数与2840亿总参数,原生支持1M超长上下文输入,输出长度最高达384K tokens,较前代128K处理能力实现8倍突破,彻底解决长文本处理瓶颈。
技术架构层面,DeepSeek-V4通过混合注意力机制创新实现全链路优化。东方证券分析指出,该模型采用DSA稀疏注意力与token维度压缩技术,显著降低计算资源需求;新增KV Cache滑窗与压缩算法有效缓解访存带宽压力,配合MoE模块一体化融合内核、TileLang领域专用语言等创新,使训练收敛速度与推理效率同步提升。能力测评显示,DeepSeek-V4-Pro在知识类评测SimpleQA中接近Gemini-3.1-Pro水平,代码生成能力位列开源模型第三,Agent能力更达行业开源模型巅峰。
硬件协同领域出现重大突破。平安证券特别强调,DeepSeek首次在官方文档中将华为昇腾NPU与英伟达GPU并列纳入硬件验证清单,标志着国产大模型开始系统性迁移至国产算力底座。据披露,昇腾950超节点预计下半年批量上市,其通过高速互联与统一调度技术,将复杂模型的企业级部署时延降低40%,吞吐量提升3倍。东北证券测算,超节点规模化落地将带动高端封装载板、液冷温控等上游环节需求激增,形成算力扩容与零部件升级的双重驱动。
国产AI芯片生态呈现协同加速态势。寒武纪基于vLLM框架完成对V4-Flash与V4-Pro的适配,代码已开源至GitHub;摩尔线程联合智源FlagOS平台,为其MTTS5000芯片实现V4-Flash模型部署。华西证券数据显示,FlagOS平台已完成V4-Flash在8款国产芯片上的全量适配,V4-Pro的迁移工作正在推进。这种"模型-框架-硬件"的协同创新,推动国产算力建设从单点替代转向全链条共振。
定价策略成为市场爆发关键催化剂。DeepSeek-V4-Flash输入价格低至1元/百万token(缓存未命中),输出价2元/百万token;Pro版本输入价12元/百万token,输出价24元/百万token。对比GPT-5.5每百万输入token5美元、输出30美元的定价,国产模型展现出显著成本优势。国信证券认为,这种性价比优势将撬动企业级AI Agent大规模落地,特别是在金融、法律等需要处理超长文档的领域,百万字上下文能力正成为行业标配。









