滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

阿里开源通义DeepResearch模型：3B参数登顶权威评测，开源生态再添利器

时间：2025-09-18 09:33:27 来源：智东西编辑：快讯团队 IP：北京 发表评论无障碍通道

阿里巴巴近日宣布，正式开源其首个深度研究智能体模型——通义DeepResearch，为全球开发者攻克复杂研究任务提供了全新工具。该模型在多个权威评测基准中表现亮眼，以30亿激活参数的轻量化设计，超越了基于OpenAI o3、DeepSeek V3.1及Claude-4-Sonnet等旗舰模型构建的ReAct智能体。

在Humanity’s Last Exam（HLE）、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA及frames等评测集中，通义DeepResearch通过创新的训练框架与推理策略，实现了性能突破。其核心优势在于解决了传统“单窗口、线性累加”模式在长周期任务中面临的“认知空间窒息”与“不可逆噪声污染”问题，确保复杂推理任务的高质量完成。

研发团队构建了以Qwen3-30B-A3B模型为基础的合成数据驱动训练链路，覆盖预训练与后训练全流程。该链路通过异步强化学习算法与自动化数据策展流程，结合真实与虚拟环境训练模块，显著提升了模型迭代效率与泛化能力。例如，在处理需要多步骤验证的研究任务时，模型可动态调整信息处理优先级，避免传统方法中因信息过载导致的性能衰减。

推理阶段，团队设计了双模式架构：ReAct模式用于精准评估模型基础能力，适用于快速验证场景；Heavy模式则通过test-time scaling策略，充分释放模型性能潜力，确保在跨领域、长周期任务中维持高水准推理。这种设计使模型既能高效处理简单查询，也可应对需要深度分析的复杂问题。

目前，通义DeepResearch的模型代码、训练框架及部署方案已通过GitHub、Hugging Face及魔搭社区全面开源。开发者可自由下载30亿参数版本（A3B）的模型权重与训练工具，快速构建定制化研究智能体。此举延续了阿里巴巴今年以来在AI智能体领域的开源策略，此前发布的WebWalker、WebDancer等检索推理模型均已成为开源社区标杆工具。

行业分析指出，通义DeepResearch的开源为深度研究赛道提供了“轻量化+高性能”的全新范式。其通过合成数据训练与异步强化学习的结合，降低了对大规模真实数据的依赖，同时保持了模型在复杂场景下的推理鲁棒性。这一特性对医疗、金融、科研等需要处理海量结构化与非结构化数据的领域具有重要价值。

更多>同类资讯

ChatGPT用户破7亿周消息180亿条：加工内容为主，女性及年轻用户占比突出

09-18

OpenAI发布青少年安全新举措：研发年龄预测，平衡隐私与自由

09-18

宇宙浩瀚神秘天体频现，人类探索脚步不停未来可期

09-18

保护臭氧层国际日：2024年臭氧层空洞缩小，恢复进程现积极趋势

09-18

NASA研究：太阳活动逆转，自2008年起渐增，空间天气或受影响

09-18

文昌国际航天城卫星超级工厂雏形初现全力冲刺预计10月底交付

09-18

万科组织架构焕新：总部领航，16地区公司、八大多元事业部协同共进

09-18

抖音“清朗”行动护航暑期：清43万+违规视频，严打侵害未成年人黑灰产

09-18

《731》未映先火，9月18日首日预售票房强势突破1亿大关

09-18

小红书半年打击虚假营销成果显著：封禁超1200万虚假账号清理超3.6亿虚假评论

09-18

小红书“打击虚假营销战队”亮相，半年封禁超1200万虚假账号成效显著

09-18

餐饮江湖“三分天下”：刚需快餐、社交餐饮、老店守将谁能执牛耳？

09-18

潮宏基拟赴港IPO：加盟店扩张与古法黄金热下，能否破局毛利率三连跌？

09-18

上海建工股价四连板，“爷叔”十年补仓即将解套仅差2角7分

09-18

离岸人民币兑美元升破7.10关口，专家解析升值动能与后续破“7”展望

09-18

点击查看更多 +

全站最新

最薄iPhone Air登场引关注，钛合金框架能否让它告别弯折之忧？

9月新机市场再添猛将！真我15携电竞独显双芯登场，性能影像双突破

泰迅发布iPhone17 Pro系列大师影像套装复古设计加持 499元起开启预售

卢伟冰9月19日直播答疑小米17系列三款机型首发骁龙8至尊版引期待

华为赋能鸿蒙智行首推旅行车享界S9T，以智能空间组合能否破局小众市场？

三星Galaxy S26 Ultra渲染图现身，一体化设计搭配圆润机身或成新亮点

热门内容

本栏最新

《731》未映先火，9月18日首日预售票房强势突破1亿大关

小红书半年打击虚假营销成果显著：封禁超1200万虚假账号清理超3.6亿虚假评论

餐饮江湖“三分天下”：刚需快餐、社交餐饮、老店守将谁能执牛耳？

潮宏基拟赴港IPO：加盟店扩张与古法黄金热下，能否破局毛利率三连跌？

上海建工股价四连板，“爷叔”十年补仓即将解套仅差2角7分

北京稻香村石艳：以创新为笔，绘就百年老字号“逆龄”发展新画卷

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.