滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI发布GPT-5.3-Codex：性能跃升，开启自主工程代理新篇章

时间：2026-02-10 01:19:14 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI 近期推出了专为代码领域设计的先进 AI 代理模型 GPT-5.3-Codex，标志着该公司在代码生成与工程自动化领域迈出了重要一步。这款模型不仅在性能上实现突破，更在响应速度和多任务处理能力方面展现出显著优势，主要面向专业软件开发人员及复杂工程级工作流场景。

在权威基准测试中，GPT-5.3-Codex 创造了多项新纪录。其中，SWE-bench Pro（Public）测试结果显示其准确率达 56.8%，该测试通过模拟多语言软件工程任务评估模型综合实力，被业界视为衡量代码代理实用性的关键指标。在 Terminal-Bench 2.0 测试中，模型成绩从上一代的 64.0% 跃升至 77.3%，该测试聚焦终端环境下的命令执行与系统操作能力，成绩提升表明其在真实开发场景中的稳定性与精准度大幅增强。

桌面级任务处理能力同样取得突破性进展。在 OSWorld-Verified 测试中，GPT-5.3-Codex 得分 64.7%，接近人类平均水平（72%），较上一代 38.2% 的成绩实现跨越式提升。该测试要求模型结合计算机视觉完成跨模态桌面操作，验证了其在复杂人机交互场景中的适应性。

产品功能层面，OpenAI 为模型引入了实时交互机制“指导（guidance）”。开发者可在模型执行复杂任务过程中动态调整方向、补充上下文信息或协同调试代码，有效解决了传统代码生成工具因上下文断裂导致的效率问题，使 AI 与人类开发者的协作流程更贴近真实场景。

底层架构方面，模型训练与部署依托 NVIDIA GB200 NVL72 系统实现。该系统通过软硬件协同设计优化推理性能，在处理复杂任务时显著降低 token 消耗成本，体现了 OpenAI 与 NVIDIA 在高性能计算领域的深度合作成果。

安全机制构建上，GPT-5.3-Codex 被纳入 OpenAI Preparedness framework 的“高能力”类别。针对生物安全与网络安全场景，模型接受了专项漏洞识别训练，并配备自动化监控系统与受控访问策略，确保技术仅用于防御性研究目的。这一设计既满足了行业对安全性的严苛要求，也为 AI 在关键领域的应用树立了新标杆。

从代码辅助工具到自主工程代理的转型过程中，GPT-5.3-Codex 展现出三大核心优势：毫秒级响应延迟、跨语言工程能力强化，以及跨环境任务执行能力提升。这些特性使其能够胜任从代码生成到系统部署的全流程自动化工作，为软件开发行业带来新的生产力范式。

更多>同类资讯

AI推理芯片新星Etched融资估值双升，国内芯片设计行业迎发展新机遇

07-02

软银持续加码AI：100亿美元已投OpenAI 10月拟再投百亿

07-02

ChatGPT用户版图持续拓展：非英语用户超半数，深度使用与场景多元双突破

07-02

英伟达开源新模型：双塔架构破解吞吐瓶颈，生成效率提升超两倍

07-02

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

在本次大会上，邬贺铨院士发表了题为《面向智能体应用的工业互联网》的主旨演讲，系统梳理了工业互联网的发展脉络，剖析了智能体嵌入工业互联网的机遇、挑战和应对之策。 PLC、SCADA、工业互联网平台是工业互联…

07-02

康迪科技控股信储新能源获施耐德授权加速AIDC储能领域布局

07-02

优必选推99万全尺寸仿生机器人，周剑坦言量产挑战大但前景可期

07-02

00后陈博远：领航通用世界基座模型，逆矩阵估值超50亿的传奇之路

07-01

景林高云程年中展望：AI革命重塑核心资产，组合锚定三大黄金赛道

07-01

三星AI内存技术双突破：HBM4E良率超70% D1d工艺11月冲刺量产认证

07-01

本末科技冲刺港交所：直驱技术领航，三大技术构建万亿赛道增长极

07-01

寒武纪登顶万亿市值背后：业绩跃迁是真，估值隐忧与行业挑战并存

07-01

7月1日A股震荡分化：沪指重返4100点半导体产业链爆发光伏产业链承压调整

07-01

华丰科技新品发布：从电互连到光互连，拓展高端互连新版图

07-01

AI赋能新趋势：Claude Code团队负责人预言未来团队需这五类新型角色

以 Claude Code 团队为例，内部传统的「岗位标签」正在被彻底撕下，取而代之的是 5 类基于行为模式的「非绑定」新型角色：原型师、构建者、清理师、增长师、维护者。随着项目逐渐成熟，他又会转向增长师和维…

07-01

点击查看更多 +

全站最新

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

半程销量领跑，上汽自主新能源海外三线并进开启新篇章

2026上海电科臻和：第一季度快乐会议精彩纷呈共赴下一季拼搏之约

石头科技6月30日股价上扬1.52% 主力资金净流入超千万回购分红同步推进

石头科技6月30日股价微涨1.52% 主力资金净流入超千万机构看好后市

大众ID.ERA 5S内饰曝光：小屏引争议，1.5L插混能否撑起务实家用？

热门内容

本栏最新

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

岚图泰山X8纯电版7月交付，配置拉满，30万级SUV市场激战将启

iCAR V27首轮大规模OTA升级来袭智能驾驶等140余项功能焕新升级

iCAR V27首轮大规模OTA升级来袭智能驾驶安全座舱全面焕新升级

缤果PRO上市月余车主反馈：好看好开又实用，城市代步新选择

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.