当大多数AI模型发布时,总少不了“全球领先”“行业第一”等宣传语,DeepSeek V4却选择了一条截然不同的路径——在技术报告中坦言其能力仍落后于GPT-5.4和Gemini-3.1-Pro,发展轨迹滞后前沿闭源模型3至6个月。这种“自揭短板”的做法在国内AI圈显得格格不入,却精准传递了其核心战略:不争最强,但求普惠。
V4的突破点在于将百万token的超长上下文能力变为所有用户的标配。无论是旗舰版Pro还是轻量版Flash,均支持这一功能,且无需额外付费。以100万token约75万汉字计算,用户可直接将整部《三国演义》输入模型,获得完整理解与分析。这一能力源于其采用的CSA与HCA混合架构,使算力需求降至前代模型的四分之一,显存消耗减少至十分之一,彻底打破了长文本处理的高成本壁垒。
在定价策略上,DeepSeek延续了激进风格。V4-Pro的输入成本为每百万token1元(缓存命中)或12元(未命中),输出24元;Flash版本则低至0.2元(命中)或1元(未命中),输出2元。这一价格仅为竞品的三分之一甚至更低。更关键的是,V4同时兼容OpenAI和Anthropic的API接口格式,开发者仅需修改一个参数即可切换,迁移成本几乎为零。
实际测试中,V4在长文本处理、代码生成与调试、复杂推理三大场景表现亮眼。以某上市公司324页年报为例,V4在19秒内准确提炼核心要点,并定位到深藏于第212页的股份回购数据及第311页的管理人员酬金信息。在代码测试中,开启深度思考模式时,V4不仅修复了预设的2至3个错误,还主动识别出除零错误、KeyError等额外问题;关闭该模式后,仍能快速定位核心错误,满足日常调试需求。复杂推理测试中,V4以商业顾问身份分析护肤品公司困境,从现金流威胁、盈利能力恶化到市场结构性风险,层层拆解问题并给出优先级排序,后续追问电商渠道风险时,更直接推导出五项新风险,逻辑链条完整。
V4的真正影响力远超产品本身。其开源策略与低价定位,正在动摇行业定价逻辑。对普通用户和中小开发者而言,顶级推理能力的使用门槛大幅降低;对大厂而言,性能接近的开源模型以极低价格提供服务,持续压缩闭源模型的溢价空间。技术报告中首次将华为昇腾与英伟达GPU并列写入硬件验证清单,更释放了关键信号:V4采用的FP4精度格式与昇腾950芯片原生支持格式完全匹配,这意味着DeepSeek正在构建不依赖英伟达的算力通道。
据内部人士透露,待昇腾950超节点下半年批量上市后,V4-Pro的成本还将进一步下调。在英伟达出口管制持续收紧的背景下,这一技术协同的战略意义远超产品发布本身。若昇腾生态真正成熟,国内AI产业将摆脱对单一硬件供应商的依赖,算力定价权与供给稳定性或迎来根本性变革。DeepSeek在技术报告中对昇腾的公开背书,已不仅是商业合作,更像是一次方向性的宣言。










