去年七月,DeepSeek的下载量从巅峰时期的八千余万骤降至两千多万,跌幅高达72.2%,这一数据变化让“DeepSeek跌落神坛”成为互联网热议话题。然而,据多位知情人士透露,这家公司正蓄势待发,计划在二月中旬推出新一代模型DeepSeek-V4,试图重夺行业领先地位。
此次发布恰逢农历新年期间,距离上一代模型DeepSeek-R1的发布已过去整整一年。新模型的核心突破在于代码生成与处理能力,内部基准测试显示,其在编程任务上的表现已超越Anthropic的Claude和OpenAI的GPT系列等主流竞品。更值得关注的是,DeepSeek团队声称解决了长期困扰AI发展的技术难题,可能为“Vibe Coding”产业带来颠覆性变革。
DeepSeek-V4的技术亮点体现在对数据模式的理解能力上。以“数草莓中字母r的数量”这一经典问题为例,上一代模型因无法理解“计数”概念,只能依赖训练数据中的错误答案,导致频繁出错。而新模型通过改进训练机制,能够真正理解任务本质,避免此类低级错误。团队还攻克了“灾难性遗忘”问题——在模型复杂度提升的过程中,V4保持了性能稳定性,未出现能力退化现象,这为构建编程Agent奠定了基础。
现代软件工程中,代码修改常涉及多文件、数千行代码的依赖关系,但传统模型受限于上下文窗口或注意力机制衰减,难以处理大型项目。DeepSeek-V4的突破使其成为“Agent时代”的潜在标杆模型。当前,AI行业的竞争焦点已从文本生成转向代码生成,后者被视为检验模型综合能力的关键指标。Vibe Coding趋势要求AI不仅能补全代码,还需理解开发者意图,实现自然语言到工程逻辑的无缝转换,而DeepSeek似乎已在这一赛道占据先机。
回顾DeepSeek-R1发布后的这一年,团队及核心成员梁文锋的学术轨迹清晰展现了技术演进路线。2025年9月,R1相关论文登上《自然》杂志封面,梁文锋作为通讯作者回应了审稿人对“是否使用OpenAI模型输出进行蒸馏训练”的质疑,并首次公开成本数据:从V3-Base到R1的后训练阶段仅花费29.4万美元(不含V3-Base约600万美元的基础训练成本)。这一数据与《自然》社论共同证明了其技术原创性,彻底扭转了外界对中国大模型“套壳”的偏见。
更直接的证据出现在2025年末,DeepSeek团队发表的论文《mHC:流形约束超连接》提出了一种新型架构,解决了传统超连接架构在模型扩容时的信号增益失控问题。通过将信号增益控制在1.6倍左右,该架构在3B至18B参数规模的测试中,使模型在BIG-BenchHard推理基准上的表现提升2.1%。这一成果由梁文锋联合署名,意味着V4可能采用此架构,在保持高效训练的同时实现参数规模与推理深度的双重突破。
2026年初,DeepSeek悄然将R1论文从22页扩充至86页,详细披露了冷启动、推理导向强化学习、拒绝采样与再微调、对齐导向强化学习等完整训练流程。业界普遍认为,这种“技术清仓”式披露预示着下一代模型已成熟,R1的技术细节不再是核心壁垒,V4将构建更高维度的竞争优势。
竞争格局方面,量化投资领域也涌现出强劲对手。2026年元旦,由九坤投资创始团队成立的至知创新研究院发布IQuest-Coder-V1开源模型,仅40B参数便在SWE-benchVerified测试中取得81.4%的分数,达到Claude和ChatGPT水平。国内互联网大厂同样加速布局:字节跳动2025年初推出Trae编程工具,集成HTML预览、Python运行等功能;阿里通义千问在12月更新至Qwen Code v0.5.0版本,支持终端窗口并行运行四个实例,实现AI编程“跳出命令行”的突破。
硬件终端层面,字节跳动与中兴通讯的合作引发关注。2025年12月,双方推出搭载豆包手机助手的努比亚M153工程样机,售价3499元,首批3万台迅速售罄,二手市场溢价明显。该助手的核心能力是跨应用操作,用户通过自然语言指令即可完成点外卖、订机票等复杂任务,标志着AI大模型从云端向终端、从工具向入口的战略转型。DeepSeek是否会跟进硬件领域,成为市场猜测的焦点。
资本市场同样迎来收获季。经历“百模大战”后,中国AI行业加速向头部集中,智谱AI和MiniMax先后上市。智谱于1月8日在港交所挂牌,发行价116.2港元/股,首日收盘涨13.17%至131.5港元,市值达578.9亿港元;次日再涨20.6%至158.6港元,市值突破698亿港元。MiniMax则以165港元/股的顶格定价上市,暗盘涨25%-29%,首日开盘暴涨42.7%至235.4港元,盘中最高触及351.8港元,最终收盘345港元,涨幅109.09%,市值达1054亿港元。尽管两家公司仍处亏损状态,但强劲的增长曲线印证了市场对高质量AI模型的付费意愿。
全球目光再次聚焦DeepSeek。一年前,这家公司以低成本路径颠覆行业认知;如今,其能否凭借V4模型再次震惊世界,答案即将在春节期间揭晓。









