阿里巴巴今日宣布,正式开源其自主研发的首个深度研究智能体模型——通义DeepResearch。该模型凭借3B激活参数,在Humanity’s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA及frames等权威评测中,性能表现超越基于OpenAI o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct智能体。
当前,通义DeepResearch的模型、框架及配套方案已通过GitHub、Hugging Face及魔搭社区全面开源,开发者和用户可自由下载模型与代码。开源版本基于Qwen3-30B-A3B模型优化,支持两种推理模式:ReAct模式用于验证模型基础能力,Heavy模式通过test-time scaling策略充分释放性能潜力,确保在长周期任务中维持高质量推理。
针对深度研究领域长期存在的“认知空间窒息”与“不可逆噪声污染”问题,阿里通义团队构建了合成数据驱动的完整训练链路。该链路覆盖预训练与后训练阶段,结合异步强化学习算法及自动化数据策展流程,通过真实与虚拟环境混合训练,显著提升了模型迭代速度与泛化能力。实验表明,该方案有效解决了传统“单窗口、线性累加”模式在处理复杂任务时的推理能力衰减问题。
作为AI研究热点,深度研究领域已吸引谷歌、OpenAI、Anthropic等企业投入研发。此次开源的通义DeepResearch通过轻量化设计(3B激活参数)实现了高性能表现,为开发者提供了攻克长周期复杂研究任务的新工具。其技术路径突破了传统方法的局限性,通过动态认知空间管理与噪声抑制机制,显著提升了模型在多步骤推理任务中的稳定性。
开源地址:
GitHub:https://github.com/Alibaba-NLP/DeepResearch
Hugging Face:https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B
魔搭社区:https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B
此次开源进一步丰富了阿里在AI智能体领域的布局。此前,阿里已陆续开源WebWalker、WebDancer和WebSailor等多款检索与推理智能体,均在开源社区取得领先成绩。通义DeepResearch的发布,标志着阿里在深度研究赛道形成了覆盖基础模型、训练框架到应用方案的完整技术体系。