DeepSeek公司近日正式推出了其最新版本——DeepSeek-V3.1,这一消息引起了业界的广泛关注。
新版本在技术上实现了重大突破,引入了创新的混合推理架构。这一架构允许模型在同一时间内支持思考模式与非思考模式,为用户提供了更加灵活的使用体验。据DeepSeek官方介绍,与之前的版本DeepSeek-R1-0528相比,DeepSeek-V3.1-Think在响应速度上有了显著提升,能够在更短的时间内为用户提供准确答案。
DeepSeek-V3.1还经过了Post-Training优化,这一改进使得新模型在工具使用和智能体任务中的表现更加出色。用户现在可以通过官方App和网页端的“深度思考”按钮,轻松地在思考模式与非思考模式之间进行切换,享受更加智能化的服务。
在API方面,DeepSeek也进行了同步升级。现在,deepseek-chat对应非思考模式,而deepseek-reasoner则对应思考模式。值得注意的是,这两个API的上下文都已扩展至128K,为用户提供了更大的信息处理能力。同时,API Beta接口还新增了strict模式的Function Calling功能,确保输出的Function符合schema定义。DeepSeek还增加了对Anthropic API格式的支持,进一步提升了其兼容性和实用性。
在价格政策方面,DeepSeek宣布将于2025年9月6日起对开放平台API接口调用价格进行调整,并取消夜间时段优惠。然而,在9月6日之前,所有API服务仍按原价格政策计费,用户可以继续享受当前的优惠待遇。
DeepSeek-V3.1采用了UE8M0 FP8 Scale的参数精度。据官方解释,这一参数精度是针对即将发布的下一代国产芯片设计的,旨在为用户提供更加高效和稳定的计算体验。