有知情人士透露,科技公司DeepSeek正紧锣密鼓地研发具备更先进AI智能体能力的新型模型,该模型预计于今年年底正式亮相。尽管官方尚未对此作出正式回应,但结合近期的一系列动态,这一消息并非空穴来风。
在8月发布的DeepSeek-V3.1版本中,官方升级公告明确指出,新模型通过后训练优化技术,显著提升了在工具使用与智能体任务中的表现,展现出更强的Agent能力。这一升级被视为DeepSeek迈向智能体时代的重要一步。
彭博社援引内部消息进一步披露,DeepSeek的下一代模型将具备“自我进化”特性,仅需少量用户提示即可执行复杂操作,并能根据历史交互数据持续优化自身性能。该模型计划于今年第四季度发布,引发行业广泛关注。
回顾DeepSeek的产品迭代路径,自去年12月至今年8月的9个月间,V系列模型仅从V3升级至V3.1,看似版本号变动微小,实则暗藏技术突破。官方公布的测试数据显示,V3.1在三大核心领域实现显著提升:
其一,混合推理架构的引入使模型能够同时处理思考型与非思考型任务,大幅提升多场景适应能力;其二,思考效率较前代模型DeepSeek-R1提升显著,实现更快速的逻辑推导;其三,Agent能力全面增强,尤其在工具调用与智能体协作方面表现突出。
具体到应用场景,编程智能体测试中,V3.1在代码修复基准测试SWE和命令行终端复杂任务测试Terminal-Bench中的得分均超越V3和R1版本。搜索智能体测试则显示,其性能较DeepSeek-R1-0528实现全方位提升,验证了技术升级的实际效果。
DeepSeek的每一次技术突破都在重塑行业格局。此前推出的R1模型曾将推理模型发展推向新高度,而近期Manus引发的智能体热潮更被业界称为“第二个DeepSeek时刻”。进入2025年下半年,智能体技术已成为各大模型厂商的标配,吴恩达等权威专家也指出,并行智能体架构正成为AI能力提升的新方向。
当DeepSeek与智能体技术结合,市场普遍预期其可能通过技术优化降低智能体应用成本。然而,也有观点质疑此时入局智能体领域是否仍具先发优势。可以确定的是,在2025年剩余时间内,大模型领域的技术竞赛将持续升温。
值得关注的是,行业另一重磅消息或即将落地——Qwen 3 max模型的发布已进入倒计时阶段,这场技术盛宴的下一个高潮值得期待。