人工智能领域迎来了一次重大突破,OpenAI公司近期推出了全新的ChatGPT智能体系统,这一创新成果在7月17日由OpenAI的首席执行官山姆·奥特曼及四位核心成员通过一场25分钟的直播向全球揭晓。
这款智能体系统整合了Operator的远程浏览器执行能力、Deep Research的网络信息整合技术,以及ChatGPT的对话优势,形成了一个统一的智能平台。它不仅能够思考,还能够行动,自主地从其技能工具箱中选择工具,并利用自身的计算能力完成任务。
奥特曼强调,这一智能体代表了AI系统能力的新里程碑。在此之前,Operator和Deep Research虽各有千秋,但各自存在局限。Operator能在网页上处理内容,却难以深入分析或撰写详细报告;而Deep Research虽擅长信息分析汇总,却无法与网站互动,无法访问需要用户身份验证的内容。OpenAI此次将两者的优势巧妙融合,打造出全新的ChatGPT智能体。
在Agent模式下,ChatGPT将使用自己的“虚拟电脑”来执行任务,根据用户的指令处理复杂的工作。用户可以与网站进行互动,甚至在同一聊天窗口中直接从对话过渡到直接请求操作,体验前所未有的便捷。
在发布会上,OpenAI展示了ChatGPT Agent在执行多项任务时的出色表现,如购买西装、制作贴纸、预订酒店等。智能体在启动虚拟电脑后,会迅速询问用户的具体需求,然后进行衣服的挑选。它会滑动网页、查看商品详情,并留下建议文字。智能体还能代替用户完成下单操作,整个过程流畅而高效。
在“虚拟电脑”中,ChatGPT能够保留任务所需的上下文,无论是使用文本浏览器还是可视化浏览器打开页面,从网络下载文件,还是在终端中运行命令进行操作,都能在可视化浏览器中查看输出。同时,ChatGPT在执行重要操作前会请求用户授权,用户可以随时中断、控制浏览器或停止任务,还可以安排已完成的任务自动重复执行,如每周生成周报。
在“人类最后一次考试”评估中,ChatGPT agent模型的SOTA得分高达41.6,当采用简单的并行部署策略进行扩展时,得分更是提升至44.4。在FrontierMath等基准测试中,ChatGPT Agent的准确率也远超之前的模型,展现了其卓越的性能。
目前,Pro、Plus和Team用户已经可以使用Agent模式,企业版和教育版用户也将在未来几周内获得访问权限。对于Pro用户,每月有400次使用次数,其他付费用户每月有40次使用次数,当然也可以通过付费获得更多的使用量。