人工智能领域迎来了又一重大突破,OpenAI公司近期正式推出了其创新的ChatGPT智能体系统,这一消息在科技界引起了广泛关注。OpenAI的首席执行官山姆·奥特曼携手四位核心成员,通过一场长达25分钟的直播,向全球观众展示了这一划时代的技术成果。
ChatGPT智能体系统并非简单的技术叠加,而是将Operator远程浏览器的强大执行能力、Deep Research网络信息整合的精准度,以及ChatGPT对话系统的流畅性完美融合,形成了一个既能思考又能行动的统一智能体平台。这一平台能够主动从广泛的代理技能中做出选择,利用内置的计算机资源,为用户执行各种复杂任务。
奥特曼在直播中强调,智能体系统的推出标志着AI系统能力达到了一个全新的高度。它不仅继承了前辈技术的优势,更在此基础上实现了质的飞跃。
在详细介绍中,我们了解到,Operator和Deep Research虽各有千秋,却始终存在局限性。Operator擅长在网页上处理内容,却难以进行深入的文本分析或撰写详尽报告;而Deep Research在信息整合方面表现出色,却无法与网站互动,优化搜索结果或访问受保护的内容。OpenAI此次的创新之举,正是将这两者的优势巧妙结合,打造出了一款功能更为强大的智能体。
在Agent模式下,ChatGPT能够利用自己的“虚拟电脑”执行用户指令,处理复杂的工作流程。用户不仅可以与网站进行互动,还能在同一聊天窗口中直接从对话过渡到具体操作请求。这一功能的实现,极大地提升了用户体验和工作效率。
在发布会上,OpenAI展示了ChatGPT智能体在执行多项任务时的出色表现,如购买西装、制作贴纸、预订酒店等。智能体在启动虚拟电脑后,会迅速询问用户的具体需求,并根据需求进行网页浏览、商品挑选等操作。它甚至能够滑动网页、查看商品详情,并留下专业的建议文字。智能体还能代替用户完成下单等关键步骤。
ChatGPT智能体在“虚拟电脑”中执行任务时,能够保留任务所需的上下文信息。它可以根据需要选择使用文本浏览器或可视化浏览器打开页面,从网络上下载文件,并在终端中运行命令进行操作。同时,智能体在执行重要操作前会征求用户权限,确保用户对整个过程的掌控力。用户可以随时中断、控制浏览器或停止任务,并可以安排已完成的任务自动重复执行。
在性能评估方面,ChatGPT智能体也展现出了卓越的实力。在“人类最后一次考试”评估中,智能体模型的SOTA得分达到了41.6,而在采用简单的并行部署策略进行扩展后,得分更是提升至44.4。在FrontierMath等基准测试中,ChatGPT智能体的准确率也远超之前的模型。
目前,ChatGPT智能体的Agent模式已向Pro、Plus和Team用户开放。企业版和教育版用户也将在未来几周内获得访问权限。为了满足不同用户的需求,OpenAI为Pro用户提供了每月400次的使用次数,而其他付费用户则享有每月40次的使用次数。当然,用户也可以通过额外付费获得更多使用次数。