ITBear旗下自媒体矩阵:

OpenAI发布GPT‑5.1‑Codex‑Max:长任务处理升级,多场景应用上线

   时间:2025-11-20 08:49:13 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

OpenAI正式推出专为长时间编码任务设计的全新Agentic模型——GPT‑5.1-Codex-Max。这款模型通过创新的“压缩技术”突破了传统上下文窗口限制,能够在单次任务中稳定处理百万量级的Token,同时实现更高效的资源利用率。相较于前代产品,新模型在性能与速度方面均取得显著提升,尤其适合需要持续运行的复杂开发场景。

在训练阶段,研发团队引入了真实软件工程任务数据,涵盖代码评审、前端开发、问题解答及PR创建等核心环节。测试结果显示,该模型在多项权威编程评测中表现优异:SWE-Bench Verified(500样本)得分达77.9%,SWE-Lancer IC SWE测评取得79.9%,TerminalBench 2.0测评成绩为58.1%,三项指标均超越前代模型。针对Windows开发环境,团队进行了专项优化,使模型在跨平台支持方面更具竞争力。

针对长时间运行任务,GPT‑5.1-Codex-Max展现出独特优势。传统模型常因上下文窗口限制导致任务中断,而新模型可在接近窗口容量时自动压缩会话内容,实现自主运行数小时甚至超过24小时。内部测试表明,在复杂代码重构和持续agent循环场景中,该模型能保持稳定输出,有效解决开发过程中的上下文丢失问题。

推理效率的提升进一步增强了模型实用性。在SWE-Bench Verified测试中,新模型完成相同任务所需的思考Token减少30%,通过“Extra High(xhigh)”模式可针对复杂逻辑投入更深度分析。这种优化不仅降低了计算成本,还显著提升了代码生成的准确性,尤其适合处理需要多步骤推理的编程任务。

目前,该模型已集成至Codex CLI、IDE扩展、云端服务及代码评审系统,面向ChatGPT高级订阅用户开放使用,涵盖Plus、Pro、Business、Edu及Enterprise全层级。OpenAI计划近期通过API向开发者提供服务,并逐步将其设为Codex平台的默认模型。此次升级标志着Agentic编码工具向工业化应用迈出重要一步,为大规模软件开发提供更可靠的自动化支持。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version