ITBear旗下自媒体矩阵:

从代码助手到工作“操作系统”:Codex更新开启AI动手干活新纪元

   时间:2026-04-18 17:13:21 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能开发工具Codex迎来重大变革,其功能边界从单纯的代码生成扩展至全流程电脑操作,这一转变被官方形容为“Codex for (almost) everything”。此次更新标志着Codex从单一编程辅助工具向智能化工作流中枢的进化,其核心突破在于实现跨应用、跨时间的任务执行能力。

最引人注目的革新是桌面级交互能力。更新后的Codex通过视觉识别屏幕内容、模拟鼠标键盘操作的方式,直接操控本地应用程序。这种突破性设计使其摆脱了对API接口的依赖,能够处理设计软件、内部系统等无开放接口的工具。在macOS系统上,用户可同时运行多个AI代理,它们在后台自主切换应用窗口,而不会干扰正常办公流程。该功能计划逐步向其他操作系统扩展。

网页交互领域同样实现突破。内置浏览器支持用户通过圈选界面元素、标注区域等方式生成操作指令,前端开发者可直接在生成页面上标注修改需求。官方透露未来将扩展浏览器控制权限,最终实现跨网络环境的完整操作能力。配合新增的原生图像生成模块,开发者可基于gpt-image-1.5模型直接生成界面素材,无需调用外部API。

这种工作流整合模式引发行业对"AI操作系统"的讨论。相较于OpenClaw通过接口调用工具的路径,Codex选择将AI能力内嵌至系统底层,实现应用层面的直接操控。这种差异或与OpenClaw创始人Peter Steinberger加盟OpenAI存在关联,但更本质的动因在于构建覆盖全场景的超级应用生态。据统计,Codex周活跃用户已突破300万,其中近半数使用场景涉及非编程任务。

竞争格局方面,Perplexity AI同期推出"Personal Computer"桌面应用,整合本地文件管理与浏览器操作,采用Claude Opus 4.7作为核心协作模型。Anthropic的产品虽具备多工具调用能力,但尚未形成统一的桌面级操作系统。国内科技企业则同步推进Agent体系构建与本地环境适配,全球AI竞争正从模型性能转向工作流渗透深度。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version