ITBear旗下自媒体矩阵:

OpenAI发布Agent模式:AI“动手”时代,我们如何与之共处?

   时间:2025-07-18 14:13:48 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

随着人工智能技术的飞速发展,2025年的AI领域迎来了一次重大变革。这次,OpenAI推出的全新Agent模式,正在重新定义人与AI的交互方式。

过去,我们习惯了与AI进行文字交流,无论是提问还是获取信息,都依赖于AI的“动嘴”能力。然而,随着Agent模式的出现,AI不再仅仅满足于“动嘴”,而是开始展现其“动手”的实力。

7月18日凌晨,OpenAI在一场直播活动中,由Sam Altman与四位研究员共同介绍了这一革命性的Agent模式。在Agent模式下,用户可以直接向ChatGPT提出具体需求,如购买婚礼所需物品、设计并打印宠物周边产品,或是生成PPT等。ChatGPT则会自行在虚拟机中操作,逐步完成任务。

从演示中可以看到,一个复杂任务在Agent模式下大约需要10分钟完成。ChatGPT在虚拟环境中能够调用文本浏览器、可视化浏览器和终端等多种工具。这些工具的组合使用,使得AI能够更高效地完成各种任务。例如,文本浏览器负责搜索信息,可视化浏览器则用于模拟键鼠交互或读取图像信息,而终端则可以运行代码、生成文件以及调用云端API等。

此次OpenAI推出的Agent模式,不再仅限于Pro用户,Plus和Team用户也将能够很快体验到这一功能,每月可使用40次。这无疑大大降低了用户的使用门槛,使得更多人能够享受到AI带来的便利。

在演示中,Agent模式展现出了惊人的能力。一个研究员要求AI规划参加朋友婚礼的事宜,包括挑选礼服、预订酒店以及提供礼物建议。Agent启动虚拟电脑后,先使用文本浏览器搜索婚礼信息、着装要求和天气等,然后切换到可视化浏览器检查礼服效果,并最终提供了详细的婚礼出行建议报告。整个过程仅用了十分钟,报告内容详尽且包含了大量链接和截图。

另一个演示则展示了Agent模式的动手能力。研究员要求AI为团队吉祥物设计一批笔记本贴纸,并下单500张。Agent随即调用图像生成工具生成了一张动漫风格的狗狗插画,作为贴纸的设计图案。接着,它打开浏览器访问Sticker Mule网站,上传设计图、填写信息,并将商品加入购物车。整个过程流畅且高效,仅在需要用户确认时暂停。

此次Agent模式的推出,实际上是OpenAI上半年推出的Operator和Deep Research两个工具的融合体。Operator能够分析图形操作界面并做出操作,而Deep Research则能够阅读大量网页并生成调研报告。两个工具的融合,使得Agent模式具备了更强的任务处理能力。

OpenAI表示,在训练模型时,他们使用了强化学习方法。模型一开始会尝试使用所有工具解决简单问题,然后通过奖励高效、合理的行为,逐渐学会如何选择合适的工具完成任务。这使得Agent模式在处理复杂任务时更加得心应手。

然而,随着Agent模式的普及,一系列新的挑战也随之而来。隐私和安全成为用户最为关注的问题之一。当AI在虚拟机中操作网页、输入个人信息时,如何保证安全成为亟待解决的问题。OpenAI表示,他们将采取严格的审查和安全措施,但同时也呼吁整个社会共同适应和建立规范。

Agent时代的到来,标志着AI技术进入了一个全新的阶段。在这个阶段,我们不仅要学会适应AI的“嘴”,更要学会适应AI的“手”。我们需要思考的是,我们愿意多信任AI?愿意把多大的权限交给它?这些问题的解决,将重新定义我们与AI的关系。

与此同时,Agent的爆发也将对就业市场产生深远影响。当AI能够独立完成包含数据检索、图像查证的复杂报告,并直接完成在线预订等任务时,我们的工作将受到怎样的影响?这是每个人都需要思考的问题。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version