ITBear旗下自媒体矩阵:

百度伐谋Agent 2.0再登MLE-Bench榜首,彰显中国AI企业级工程化硬实力

   时间:2026-04-11 05:44:22 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

在机器学习工程领域,一场由百度智能云引领的技术革新正引发全球关注。其自主研发的企业级算法优化智能体——百度伐谋Agent 2.0,近日在权威基准测试MLE-Bench中以绝对优势登顶,并刷新了最优成绩(SOTA)。这是该系统继去年首次问鼎后,再次以工程化能力证明中国AI在复杂问题求解领域的领先地位。据悉,全新升级的2.0版本将于2026年5月的百度AI开发者大会上正式亮相。

MLE-Bench由OpenAI主导设立,堪称智能体实战能力的"试金石"。该测试集包含75个源自Kaggle竞赛的真实工程难题,全面考察AI在模型训练、数据处理、实验优化等全流程中的端到端能力。百度伐谋2.0在此次评测中展现出卓越的攻坚实力,尤其在处理高复杂度任务时,其综合胜率大幅领先搭载Claude-Opus-4.6等主流大模型的同类系统,验证了其在系统性问题拆解与迭代优化方面的成熟度。

技术突破的背后是多项核心能力的升级。新版本引入的增强型演化策略,使智能体能够并行探索多条解决方案路径,并通过动态回溯机制持续优化;长程记忆机制则赋予系统类似人类工程师的逻辑连贯性,确保在跨步骤任务中保持决策一致性。更值得关注的是,依托百度智能云全栈AI基础设施的深度优化,算法迭代效率获得质的提升,为处理超大规模工程问题奠定基础。

在降低使用门槛方面,百度伐谋2.0实现了革命性突破。业务人员无需算法背景,仅需通过自然语言描述需求或上传数据文件,系统即可自动生成可解释、可交互的决策方案。这种"零代码"操作模式,使得企业级AI解决方案的落地周期从数月缩短至数周,真正实现了技术普惠。

实际应用场景中,百度伐谋已展现出强大的产业赋能能力。在汽车制造领域,阿尔特太乙公司借助该系统开发的御风智能预测系统,将风阻验证时间从10小时压缩至分钟级,整车研发周期平均缩短25%;金融风控领域,中信百信银行通过7×24小时风险特征挖掘,使模型区分度提升2.41%,效率翻倍;能源基建方面,中国能建广东院应用该技术优化海上风电电缆布局,节省近一周工期与大量材料成本;交通信控领域,鄂尔多斯伊金霍洛旗引入智能信控平台后,高峰时段车均延误降低18%,通行时间缩减超50%。

科研创新领域同样传来捷报。北京工业大学团队将其应用于中国空间站微型气相色谱柱设计,通过自动化寻优替代人工仿真,分离效率获得显著提升;天津大学灾害预测团队利用该系统,将原本需要数周的模型选优流程压缩至6小时内完成。为进一步推动科研范式变革,百度智能云近期开源了Famou for Science项目,构建包含实验管理、文档评审等角色的虚拟科研团队,支持长线程任务的自动化推进与知识融合创新。

从技术榜单到千行百业,百度伐谋2.0的突破不仅刷新了工程能力指标,更标志着中国AI在解决真实世界复杂问题方面已形成独特优势。这种将前沿算法与产业需求深度结合的实践,正在重新定义企业级AI的应用边界。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version