ITBear旗下自媒体矩阵:

中国移动九天GUI Agent突破技术壁垒,登顶国际自主智能体评测榜首

   时间:2025-08-01 23:18:59 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

中国移动在人工智能领域取得了重大突破,其九天人工智能研究院研发的端侧自主智能体模型JT-GUIAgent-V2,在谷歌AndroidWorld自主智能体动态基准评测国际榜单中荣登榜首。这一成就不仅彰显了中国移动在端侧复杂智能体系统人机交互技术上的国际领先实力,更为智能终端、智能网联汽车、智能机器人等领域的智能化发展开辟了新路径。

AndroidWorld作为谷歌研究人员联合发布的高专业性与权威性基准测试平台,为自主智能体提供了一个功能完备的Android环境。该环境包含了20款主流Android应用程序,并设计了116项涵盖日程管理、信息交流、系统设置等日常活动的任务,确保了评测结果的高可重复性与可比性。在这样的高标准下,JT-GUIAgent-V2以67.2%的任务成功率脱颖而出,超越了基于GPT-4o、Gemini2.5、Seed1.5-VL等基座模型驱动的多个GUI Agent框架和模型。

GUI Agent,即图形用户界面智能体,是一种前沿的人工智能代理系统。它能够模拟人类操作指令,如点击、输入、拖拽、读取界面信息等,实现复杂任务的自动化处理。JT-GUIAgent-V2就像端侧的“自动驾驶系统”,能够代替用户与各种软件应用进行自动交互,极大地提升了工作效率和用户操作体验。在信息消费“新三样”——智能终端、智能网联汽车、智能机器人等领域,GUI Agent的应用前景尤为广阔。

然而,GUI Agent在实际应用中面临着诸多挑战,包括如何准确感知理解动态多变的多模型UI界面、如何高效推理复杂长链条任务、以及在任务执行过程中如何实现自动纠偏处理等。针对这些难题,九天GUI Agent进行了全面升级。JT-GUIAgent-V2在架构设计和智能规划上实现了质的飞跃,相比之前的V1版本,在自然语言指令理解、UI元素多模态感知、目标任务识别推理以及自动化执行等方面均取得了显著进步。

JT-GUIAgent-V2的核心技术优势主要体现在两大创新上。首先,它自主构建了两阶段的协同框架,包括全局规划智能体(Planner)和感知定位智能体(Grounder)。Planner专注于高阶策略规划,提升了复杂任务推理能力和环境适应性;而Grounder则确保界面元素的精准识别与操作执行,二者协同工作,形成了完整的决策闭环。其次,JT-GUIAgent-V2创新性地引入了经验驱动的智能规划方法,通过实时融合用户指令解析与应用操作经验,实现了系统的动态决策优化,从而提升了规划的精准性、降低了错误率,并使任务更加通用化。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version