DeepSeek官网近日对API文档进行了重要更新,其旗舰大模型DeepSeek-V4-Pro的优惠活动期限得到显著延长。根据最新公告,原定于5月6日结束的2.5折优惠将延续至5月31日23:59,为开发者提供更充裕的采购窗口。这一调整反映出市场对高性能大模型持续旺盛的需求。
在技术架构层面,DeepSeek-V4-Pro采用创新的混合专家(MoE)设计,总参数量突破1.6万亿规模,单次激活参数达490亿级别。该模型特别强化了长文本处理能力,支持百万级token的上下文窗口,在金融、法律等需要深度文本分析的领域具有显著优势。目前输入价格(缓存命中)已降至每百万tokens 0.025元,未命中缓存时为3元,输出价格为6元。
产品命名体系同步迎来优化,现有deepseek-chat与deepseek-reasoner两个接口将逐步淘汰。为保障兼容性,这两个接口将分别映射至deepseek-v4-flash的非思考模式与思考模式。全系列模型的价格体系也进行结构性调整,输入缓存命中价格自4月26日20:15起降至首发价的十分之一,显著降低企业级应用的成本门槛。
服务能力方面,官方坦言当前Pro版本受高端算力供应限制,服务吞吐量存在瓶颈。不过随着昇腾950超节点预计下半年批量上市,模型运行效率将获得质的提升。此前昇腾全系超节点已通过兼容性认证,这为后续大规模商业化部署奠定了硬件基础。行业观察人士指出,算力基础设施的完善或将触发新一轮价格调整。











