ITBear旗下自媒体矩阵:

无需Skills也能进化!原位自进化Agent开启AI工具自主创造新纪元

   时间:2026-01-27 00:08:06 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能领域迎来了一项突破性进展:一种能够自主创造工具的智能体架构正式问世。这项由中国研究团队开发的技术,通过让智能体在执行任务过程中动态生成所需工具,实现了推理阶段的持续进化,为通用人工智能的发展开辟了新路径。

传统智能体系统面临显著局限:当任务需求超出预设工具范围时,系统要么无法完成,要么需要人工干预补充工具。新架构通过引入"工具优先"策略,使智能体能够根据任务需求实时开发新工具。研究团队构建的原型系统在处理复杂查询时,能够自主创建并验证工具的有效性,在遇到错误时还会进行迭代修复。

实验数据显示,该系统在五个权威基准测试中累计生成了128个工具。在Humanity’s Last Exam(HLE)测试中,其表现仅次于GPT5.2-Pro智能体,在复杂检索与推理任务中甚至超出官方基准线近20个百分点。更引人注目的是,这些工具并非随机生成——当工具数量达到97个后,系统在新任务中复用现有工具的比例显著提升,最终稳定在128个工具的优化集合。

技术实现层面,研究团队设计了包含四个核心角色的协作框架:管理者负责任务分解与工具匹配,工匠角色现场开发新工具,执行者运用工具处理任务,整合者完成结果汇总。这种分工机制通过"测试时收敛"指标进行优化,使系统能够在单个任务周期内完成工具开发、验证与部署的全流程。为提升效率,团队还引入了批量处理机制,允许系统同时处理相似任务群组,加速知识积累。

工具使用分析揭示了有趣的现象:排名前五的工具包括网页搜索、内容获取和计算器等基础功能,这些高频工具的使用次数远超其他工具,呈现出明显的马太效应。这种分布模式与人类工作习惯高度相似,表明系统在工具开发过程中自发形成了最优工具集。当处理2023届毕业生数据查询这类复杂任务时,系统能够自主创建数据过滤和统计分析工具,而无需依赖预设模板。

该架构的开源特性引发了业界广泛关注。相比传统需要海量标注数据的训练模式,这种推理阶段进化机制显著降低了开发成本。研究团队仅用15万元实验经费就完成了全流程验证,其核心代码、实验日志和评测数据已全部公开。这种轻量化开发模式为中小企业和开源社区提供了新的技术路径,有望推动智能体技术的快速普及。

技术文档显示,该系统在金融、医疗等对准确性要求极高的领域具有独特优势。通过代码执行的二元反馈机制,系统能够自动验证工具有效性,避免了大语言模型常见的幻觉问题。当处理医疗查询时,系统会自主创建症状匹配工具,并通过调用权威医学数据库进行验证,这种可解释的执行过程显著提升了结果可靠性。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version