OpenAI近日宣布对旗下AI开发工具Codex进行重大升级,推出多项突破性功能,旨在将AI助手深度融入开发者工作流程,显著提升工作效率。此次更新最引人注目的是为Mac用户引入了后台光标级交互能力,使AI能够像人类一样操作电脑应用程序,同时不影响用户正常使用其他软件。
据科技媒体报道,OpenAI产品管理总监卡弗里·林奇表示,新功能允许AI在后台使用电脑应用,而非接管整个系统操作。这意味着开发者可以同时进行手动操作和AI辅助工作,AI助手能够在用户无感知的情况下完成信息搜集、代码编写等任务。这一特性特别针对开发者日常工作中大量耗时的协调沟通和信息整理环节,通过自动化处理这些低效工作,让开发者能够专注于核心创作任务。
更新后的Codex已集成到现有ChatGPT账户中,用户无需配置API密钥即可直接使用。Windows用户虽然暂时无法体验完整的光标级交互功能,但仍可通过核心桌面应用获取信息并展示在Codex界面中。OpenAI透露,后台操控功能将很快向欧盟和英国用户开放,并逐步扩展至Windows平台。
此次升级将Codex转变为一个统一的工作平台,覆盖从代码编写到远程基础设施管理的全流程。新增功能包括:内置应用内浏览器,支持开发者直接在浏览器页面添加评论;集成gpt-image-1.5视觉模型,能够结合屏幕截图和代码生成产品概念图、前端设计等视觉内容;扩展侧边栏提供PDF、电子表格等非代码文件的预览功能,并配备摘要面板追踪智能体计划;终端支持多标签页和SSH远程开发环境连接(目前处于阿尔法测试阶段)。
为串联这些分散功能,OpenAI新增了90余款插件,涵盖Atlassian Rovo、CircleCI、GitLab Issues等开发工具。这些插件使Codex能够跨工具收集上下文信息并执行相关操作,用户可以通过@提及指定应用,或让AI自行判断最佳工具选择。例如,当用户需要处理GitHub拉取请求时,Codex可以自动调取相关代码、测试结果和文档,无需在不同应用间切换。
自动化能力是此次升级的另一重点。Codex现在支持复用对话线程和上下文信息,能够自主安排跨天甚至跨周的长期任务,并在预定时间自动唤醒执行。记忆功能预览版可以记住用户偏好、历史修正内容和搜集到的信息,减少每次新会话的自定义指令需求。更智能的是,AI会根据上下文主动建议后续操作,如生成待办清单、提示项目进度或整合来自Slack、Notion等平台的信息。
以产品经理的工作场景为例,Codex可以自动抓取Slack新需求、Gmail邮件和Notion文档更新,将相关信息整合到开发流程中。开发团队则能部署智能体自动处理各种杂务,如同步代码库、更新文档或监控测试结果。这种自动化处理显著减少了手动操作和重复劳动,使团队能够专注于高价值工作。
此次升级标志着AI开发助手从简单对话交互向全流程自动化、上下文智能协同的方向演进。虽然新功能仍处于早期预览阶段,但其潜力已引起行业关注。值得注意的是,竞争对手Anthropic Claude在今年3月也推出了类似功能,支持桌面端产品开箱即用。随着AI持续渗透操作系统和开发工具链,开发者工作方式正经历深刻变革,人机协作的边界不断拓展。











