OpenAI在发布GPT-5.2系列模型后迅速推出新一代智能体编码模型GPT-5.2-Codex,该模型以专业软件工程和防御性网络安全为核心突破方向,旨在强化其在AI编程领域的技术优势。根据官方披露,新模型在编码性能、网络安全能力及长周期任务处理方面实现显著提升,已在付费ChatGPT用户端全面上线,API接口开放工作正在推进中。
技术测试数据显示,GPT-5.2-Codex在两项权威基准测试中刷新纪录:SWE-Bench Pro测试准确率达56.4%,Terminal-Bench 2.0测试准确率达64.0%。相较于前代模型GPT-5.2(55.6%)和GPT-5.1(50.8%),新模型在解决实际软件工程任务和真实终端环境操作方面的表现均有提升。OpenAI特别指出,该模型通过上下文压缩技术优化了长周期工作能力,在代码重构、系统迁移等复杂项目中展现出更强的稳定性。
网络安全领域成为此次升级的重点方向。OpenAI披露,从GPT-5-Codex到GPT-5.2-Codex历经三次能力跃升,新模型已具备解决专业级多步骤安全挑战的能力。尽管尚未达到"高"级别网络安全标准,但公司正按照未来模型可能突破该门槛的规格进行规划。一个典型案例显示,安全研究人员使用上一代模型GPT-5.1-Codex-Max时,意外发现React框架中三个未知漏洞并协助修复,凸显AI在防御性安全中的实用价值。
针对模型能力提升带来的潜在风险,OpenAI推出多重防护机制。在技术层面,新模型集成了专门的安全训练模块、智能体沙箱环境和可配置网络访问控制;在应用层面,公司启动"可信访问计划"试点,仅向通过审查的安全专业人员和机构开放高级权限。参与该计划的主体可合法开展漏洞研究、红队测试等双重用途工作,同时解除传统安全研究中模拟攻击行为时的操作限制。
OpenAI首席执行官Sam Altman在社交平台强调,新模型标志着AI技术进入"真实影响阶段"。他透露,团队正在招聘网络安全领域专业人才,计划通过持续迭代使Codex系列模型在明年实现百倍性能提升。目前付费用户已可通过Codex界面体验新功能,API接口预计在未来数周内完成安全部署并向开发者开放。
行业观察人士指出,OpenAI此次升级直指谷歌Gemini系列模型的竞争软肋。上周发布的GPT-5.2Thinking版本已在编码能力测试中超越人类专家水平,此次针对性强化网络安全和大规模项目处理能力,进一步巩固了其在AI编程工具市场的领先地位。随着可信访问计划的实施,专业安全团队将获得更强大的技术支撑,但如何平衡创新速度与风险管控仍是行业面临的共同挑战。










