ITBear旗下自媒体矩阵:

ChatGPT Agent重磅登场:统一智能体展现强大现实世界任务处理能力

   时间:2025-07-18 13:13:12 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

OpenAI近期推出了一项重大更新,其首席执行官奥特曼亲自带领团队,在一场25分钟的直播活动中揭晓了名为“ChatGPT Agent”的创新技术。这一统一智能体的问世,标志着ChatGPT在处理现实世界复杂任务能力上的飞跃。

ChatGPT Agent能够响应诸如“检查我的日历并概述即将到来的客户会议重点”,“规划并购买为四人准备的日式早餐所需食材”,以及“分析三个竞争对手并制作演示文稿”等指令。它能够智能地浏览网页、筛选信息、在必要时提示安全登录、执行代码分析,甚至直接生成可编辑的PPT和Excel文件来总结分析结果。

奥特曼表示,ChatGPT Agent利用计算机执行复杂任务的能力,让他个人感受到了通向通用人工智能(AGI)的重要一步。

目前,ChatGPT的专业版(Pro)、增强版(Plus)和团队版(Team)用户均可以访问这一新功能。使用方式依旧简便,只需在ChatGPT的原页面中,通过“工具”下拉菜单选择“Agent mode”即可开启。

ChatGPT Agent融合了此前三大技术创新的精髓:Operator与网页交互的能力、Deep Research整合信息的技巧,以及ChatGPT本身的对话智能。在“Agent mode”下,ChatGPT能够直接调用用户的计算机资源,包括智能浏览网页、筛选结果、运行代码、生成报告等。

为了直观展示ChatGPT Agent的实力,OpenAI团队模拟了一个真实场景:用户上传一张团队吉祥物的图片,ChatGPT随即将其转化为漫画风格的贴纸,并订购了500张送至指定地址。整个过程从搜索、创作到执行,一气呵成。

团队还展示了ChatGPT Agent制作PPT的能力。它能够从Google云中提取数据,自动生成包含图表的PPT。经过模型的自我审视和优化,最终生成的PPT图表既专业又精美。

在多个评估测试中,ChatGPT Agent均刷新了业界基准。在网页浏览和现实任务完成能力测试中,它展现了卓越的性能。在人类最后考试(HLE)中,ChatGPT Agent得分高达41.6%,采用并行策略后更是提升至44.4%。在最难的数学基准测试FrontierMath中,通过使用工具,它的准确率达到了27.4%,远超之前的模型。在评估知识工作任务性能的基准测试中,ChatGPT Agent的表现与人类相当或更优,同时明显优于其他模型。在Excel编辑能力的测试中,它的得分也远高于Excel中的Copilot。

随着OpenAI ChatGPT Agent的推出,AI Agent领域的竞争格局变得更加多元化。2025年被视为全球AI Agent技术爆发的元年,行业正从基础大模型的竞争转向智能体的实际应用。在通用领域,中国团队开发的“Manus”已引起广泛关注。在垂直领域,亚马逊云科技也发布了企业级Agent部署平台Amazon Bedrock AgentCore,为开发者提供了从概念验证到生产部署的全方位支持。

如今,AI Agent市场已形成了“通用与垂直”、“端到端与多模型”、“C端工具与B端平台”的三维竞争格局。OpenAI ChatGPT Agent的强势加入,无疑将推动这一领域的进一步发展和创新。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version