人工智能领域迎来重要进展,DeepSeek正式推出两款全新AI模型——DeepSeek-V3.2与DeepSeek-V3.2-Speciale。其中V3.2主打日常应用场景,在推理性能与输出效率上实现突破;Speciale版本则聚焦极限推理能力,在国际顶级竞赛中斩获多项金牌。这一成果标志着开源模型与闭源商业模型的技术差距进一步缩小。
在核心性能方面,DeepSeek-V3.2展现出显著优势。公开测试数据显示,该模型推理能力达到GPT-5水平,仅略逊于Gemini-3.0-Pro。与同类产品Kimi-K2-Thinking相比,其输出长度减少40%以上,计算开销降低35%,用户等待时间缩短近半。官方渠道已全面升级,网页端、移动应用及API服务均完成版本迭代。
增强版V3.2-Speciale在数学与编程领域创造历史性突破。该模型不仅在IMO 2025、CMO 2025、ICPC全球总决赛及IOI国际竞赛中包揽金牌,更在ICPC与IOI项目中分别达到人类选手第二名与第十名的竞技水平。技术团队通过融合DeepSeek-Math-V2的定理证明模块,使模型具备严谨的逻辑验证能力。不过研发团队特别说明,该版本处理复杂任务时Token消耗量是标准版的3倍,目前仅开放研究用途,暂不支持工具调用功能。
技术创新层面,V3.2首次实现思考模式与工具调用的深度整合。通过构建包含1800个虚拟环境、8.5万条复杂指令的强化学习体系,模型在智能体任务中的表现超越所有开源竞品。测试数据显示,其在未针对特定工具优化的条件下,工具调用准确率较前代提升27%,与闭源模型的差距缩小至8个百分点。技术报告披露,这种训练方法显著增强了模型的泛化能力。
在应用适配方面,V3.2推出双模式运行机制。用户可根据需求选择标准模式或思考模式,后者支持多轮工具调用与逻辑推演。API服务新增对Claude Code生态的支持,开发者可通过简单配置启用深度思考功能。不过研发团队提醒,非标准工具组件如Cline、RooCode仍需使用非思考模式,相关适配工作正在推进中。
开源社区同步迎来重要更新。两款模型的完整代码与训练数据集已在HuggingFace和ModelScope平台开放下载,技术白皮书详细披露了DSA稀疏注意力机制等核心算法。为促进学术研究,Speciale版本的临时API服务将持续开放至12月中旬,期间保持原有定价体系,最大输出长度扩展至128K字符。
实验性版本V3.2-Exp的验证结果为本次发布提供重要依据。两个月前的用户对比测试显示,该版本在32个典型场景中的表现均不弱于前代旗舰模型V3.1-Terminus,特别在长文本处理场景中展现出显著优势。这些反馈数据直接推动了稀疏注意力机制的优化升级,最终促成新一代模型的诞生。










