滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

ChatGPT Agent：OpenAI新力作，开启人机协作生产力新篇章

时间：2025-07-19 20:11:32 来源：智能进化论编辑：快讯 IP：北京 发表评论无障碍通道

在科技界的平静夜晚，OpenAI突然投掷了一枚震撼弹，将全球的目光聚焦于北京时间7月18日凌晨的一场简短直播发布会。没有繁琐的预热，也没有璀璨的舞台，仅凭Sam Altman和他的团队25分钟的介绍，ChatGPT Agent横空出世，成为新时代的焦点。

ChatGPT Agent，这位新晋的智能行动者，与我们熟悉的聊天机器人大相径庭。它拥有自己的虚拟电脑，能够独立思考、规划并执行一系列复杂任务。在直播中，观众目睹了Agent熟练操控浏览器、解析网页、调用API、制作PPT和表格的全过程，令人叹为观止。Sam Altman直言不讳：“看着它工作，我感受到了AGI（通用人工智能）的真实存在。”

发布会令人印象深刻之处有三：一是面对复杂多目标任务，Agent虽耗时较长，但完成度极高；二是人机协作体验显著，用户可以随时打断Agent，补充信息或指导，甚至增加新任务；三是Agent通过专属虚拟电脑执行任务，过程可视化，用户可回放视频查看每一步操作。

ChatGPT Agent的诞生，是OpenAI在智能体领域深耕细作的必然成果。今年早些时候，Deep Research和Operator两大工具相继问世，但各有短板。Deep Research擅长长文阅读，却难以应对需要登录和交互的网页；Operator则擅长处理交互式和可视化网页，却在深度分析和长文阅读上力不从心。而复杂任务往往需要两者的结合。Sam Altman在发布会上道出了人们的心声：“我们渴望一个统一的智能体，能自主运行，使用专属电脑，完成复杂任务。它能无缝切换，从思考到行动，使用各种工具，如终端、网页操作，甚至生成文件。”

ChatGPT Agent正是Deep Research和Operator强强联合的产物，它兼具分析与执行能力，仿佛拥有了“大脑”和“双手”。在发布会上，Agent展示了一个多目标任务的执行过程：用户为参加朋友婚礼，需要准备服装、礼物和预订酒店。Agent确认需求后，耗时20分钟，提供了详尽的方案，包括五件服装选项及购买链接。当用户新增参观美国职业棒球联盟所有球场的旅行计划时，Agent迅速生成了精确的Excel行程表。

Agent的强大，源于其专属的虚拟电脑和工作台。工作台上集成了文本浏览器、可视化浏览器、终端和API等工具。文本浏览器如同Agent的“大脑”，快速抓取和解析网页文本，高效处理信息。可视化浏览器则是Agent的“眼睛”和“手”，让它能像人一样浏览和操作网页。终端和API让Agent能够运行代码、进行数据分析、处理文件，甚至生成PowerPoint和Excel文件。在发布会上，Agent自行编写代码编译幻灯片，并调用图像API美化页面的场景，给观众留下了深刻印象。

OpenAI通过强化学习训练Agent，使其在面对复杂任务时，能自主规划并智能选择最优工具组合。例如，在预订餐厅时，Agent会先用文本浏览器筛选，再用可视化浏览器查看菜品图片，最后确认空位并完成预订。这种高度自主和智能的选择能力，是Agent区别于其他AI工具的关键。

ChatGPT Agent不仅在硬实力上表现出色，其高度协作的交互模式更是软实力所在。过去，我们与AI的交互是僵硬的，只能等待任务完成。而ChatGPT Agent被设计成一个真正的“协作伙伴”，用户和智能体可以随时主动沟通。在Agent执行任务的任何时刻，用户都可以插话，补充要求、纠正方向或改变任务。Agent会理解新的指令，并在不丢失已有进度的前提下继续工作。同时，Agent也会主动沟通，提出澄清性问题或寻求用户确认，确保任务始终在掌控之中。用户还拥有最终的“接管权”，可以随时暂停Agent的操作，直接进入虚拟环境修改，增强了用户的安全感和控制感。

为了证明ChatGPT Agent的实力，OpenAI公布了一系列基准测试成绩。在HLE基准测试中，Agent取得了41.6%的分数，几乎是此前模型的两倍。在前沿数学基准FrontierMath上，Agent在工具辅助下达到了27.4%的准确率。在BrowseComp和WebArena测试中，Agent同样表现优异。在SpreadsheetBench测试中，Agent的得分高达45.5%。这些数字背后，反映出ChatGPT Agent在通用推理、专业知识、工具使用和任务执行等多个维度上，已达到全新高度。

尽管ChatGPT Agent展现出强大能力，但Sam Altman也坦诚地强调了其“前沿和实验性”，并揭示了潜在风险。最大的担忧之一是“提示词注入”攻击，当Agent访问恶意网站时，可能会执行不当操作。OpenAI已构建多层防御体系，但仍无法阻止所有攻击。随着AI能力的增长，如何划定安全的伦理和技术边界，已成为行业共同挑战。因此，OpenAI建议用户充分意识到风险，不随意透露个人敏感信息。

更多>同类资讯

C919商业运营加速：产业链利润分化，核心企业领跑价值赛道

03-19

2026年“长征六号甲”再出征成功发射遥感五十号02星助力多领域发展

该箭芯级主动力沿用了新一代“长征”火箭的标准配置，芯一级配备2台YF100液氧煤油发动机、芯二级配备1台YF-115系列液氧煤油发动机，在中国首创液体芯级捆绑固体助推级的构型模式，结合了固体动力推力大、维护简…

03-19

玉兔二号超期服役7年多：月球背面“神秘小屋”竟是可爱“玉兔石”

这也是为什么玉兔二号月球车在月球背面运行了7年多时间，却只行驶了1000多米的原因。在这一次任务中，嫦娥七号探测器也会携带一辆月球车，还有一个独创的飞跃器，当嫦娥七号探测器成功登陆月球表面后，不仅有月球车在…

03-19

“十五五”启航：中国航天迈向万亿级产业深空探索与民生应用双突破

“十五五”期间，国家将把航天打造成市场化、可批量生产的常规产业，彻底告别单次定制、成本高昂的老模式。深空领域，将探索太阳系边际；深化火星探测二期工程；开展近地小行星防御，监测并偏转威胁天体；打造可重复使用…

03-19

从千年天关客星到自主卫星：科学家张永合的宇宙探索之路

2012年，中国科学院国家天文台研究员袁为民和张臣博士找到在中国科学院微小卫星创新研究院工作的张永合，希望能合作研制一颗卫星，用于观测类似天关客星这样的宇宙暂现天体。目前，张永合正带领卫星团队研制一台旗舰型的…

03-19

中国登月新布局：从火箭测试到地下训练，稳步迈向“驻月”时代

中国提出的“月球驿站”，不是简单的登月落脚点，而是一套完整的生存系统，能让航天员在月球长期驻扎、开展科研活动。月球就像一个“太空中转站”，未来我们要去探索火星、小行星，都可以先在月球补给物资、休整人员、测…

03-19

中国科学家“笨办法”挖数据 4.5万光年外“峨眉”星团现真容

在这片星光里，有两个此前从没人发现的“蓝色婴儿”星团，何治宏给它们命名为“峨眉一号”和“峨眉二号”。何治宏调出一张等高线图，上面有两个密集的区域，“你看，这是气体的轮廓，峨眉一号和峨眉二号就在这团气体里，有…

03-19

中国代表：中东局势正被推向危险深渊

03-19

AI算力驱动散热需求爆发，上市公司密集布局液冷赛道

03-19

美国前反恐中心主任重申对伊开战缺乏情报依据

03-19

美福特号航母起火后赴地中海维修

03-19

阿布扎比Habshan天然气设施停运

03-19

美媒：美国防部寻求拨款2000亿美元用于对伊战争

03-19

澳股开跌1.54%

03-19

112.28亿元市值限售股今日解禁

03-19

点击查看更多 +

全站最新

美股异动｜美光科技盘后跌幅一度扩大至6%，开支庞大掩盖存储芯片销售强劲表现

广汽新作启境GT7来袭，猎装轿跑新选择，或成小米SU7强劲对手

2026零售数字化浪潮下，伯俊科技收银方案如何赋能企业转型升级？

美联储点阵图中值：2026年将累计降息25个基点

美股三大指数均跌超1%，哈莫尼黄金跌超8%，中概指数跌2.06%

硬派SUV市场热潮涌动五款新车蓄势待发谁将引领新潮流？

热门内容

本栏最新

美股异动｜美光科技盘后跌幅一度扩大至6%，开支庞大掩盖存储芯片销售强劲表现

美联储点阵图中值：2026年将累计降息25个基点

美股三大指数均跌超1%，哈莫尼黄金跌超8%，中概指数跌2.06%

安凯新能源车绝缘故障排查与解决：从报警到恢复行驶的全过程

断油危机升级！多国紧急应对：一边找油，一边省着用

公告精选︱安琪酵母：宜昌高新区公司拟7.97亿元实施白洋生物科技园项目二期；顺灏股份：轨道辰光的“天数天算”业务可能在未来5年内才有明确的商业价值

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.