滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OpenAI发布GPT-5.4：推理编程能力跃升，原生电脑操控引领专业工作新变革

时间：2026-03-06 09:44:02 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI近日推出全新大模型GPT-5.4，在专业工作场景中展现出显著突破。该模型分为两个版本：面向复杂推理任务的Thinking版和满足企业高端需求的Pro版，分别针对付费用户和企业级客户开放。此次升级首次将前沿推理、编码与智能体能力整合至单一模型，标志着人工智能在专业领域的应用迈入新阶段。

在核心功能方面，GPT-5.4 Thinking新增"思考过程预览"功能，允许用户在模型响应过程中实时调整方向。该功能已在网页版和Android应用上线，iOS版本即将推出。模型在处理复杂查询时，能够预先展示推理思路，减少沟通成本。针对长上下文任务，新模型通过增强深度网络研究能力，在保持对话连贯性方面表现优异，特别在需要长时间思考的场景中，能持续追踪对话前序步骤。

计算机操控能力成为本次升级的最大亮点。GPT-5.4是OpenAI首个具备原生计算机使用能力的通用模型，支持通过屏幕截图和键盘鼠标指令操作计算机软件。在OSWorld-Verified基准测试中，该模型以75.0%的任务成功率超越人类平均水平72.4%，较前代GPT-5.2的47.3%实现质的飞跃。在WebArena-Verified浏览器测试中，结合DOM和截图驱动交互的成功率达67.3%，Online-Mind2Web测试中仅凭截图观察即实现92.8%的高成功率。

专业工作表现方面，新模型在44个职业领域的GDPval基准测试中，83.0%的项目达到或超过行业专业水平，前代模型这一比例为70.9%。在投行级电子表格建模任务中，GPT-5.4平均得分87.3%，较GPT-5.2的68.4%提升显著。演示文稿评估显示，68.0%的评审者更偏好新模型生成的内容，主要优势体现在美学设计、视觉变化和图像运用能力上。错误率方面，单个陈述错误率降低33%，完整回答出现错误的可能性减少18%。

编码能力持续强化，GPT-5.4融合了GPT-5.3-Codex的编码优势，在SWE-Bench Pro基准测试中表现持平或更优，同时延迟更低。Codex的"/fast"模式使token生成速度提升1.5倍，保持同等智能水平。新增的"工具搜索"功能在Scale MCP Atlas基准测试中，在维持准确率的前提下减少47%的token消耗量。Toolathlon基准测试显示，新模型能用更少交互轮次实现更高准确率。

视觉感知能力同步提升，在MMMU-Pro视觉理解测试中取得81.2%的成功率，OmniDocBench文档解析测试的平均错误率降至0.109。网络搜索能力在BrowseComp基准测试中较前代提升17个百分点，Pro版本更创下89.3%的新高。安全性方面，新模型延续前代安全防护措施，引入"CoT可控性"开源评估，降低思维链控制风险。

定价策略采用效率优先模式，API接口中GPT-5.4每百万输入token定价2.5美元，输出token15美元；Pro版本分别为30美元和180美元。尽管单价较前代有所上涨，但更高的token效率使许多任务的总成本降低。批量处理和Flex定价为标准费率的一半，优先处理为两倍费率。

发布计划显示，GPT-5.4 Thinking即日起面向ChatGPT Plus、Team和Pro用户开放，逐步取代GPT-5.2 Thinking版本。前代模型将在"遗留模型"部分保留三个月至2026年6月5日退役。Enterprise和Edu计划用户可通过管理员设置启用早期访问，Pro和Enterprise用户可申请使用GPT-5.4 Pro版本。API层面，新模型以gpt-5.4名称提供支持，Pro版本命名为gpt-5.4-pro，Codex支持100万token上下文窗口的实验性功能。

更多>同类资讯

中国船舶集团一季度生产热潮涌动多型新船交付下水展现硬实力

03-28

比亚迪居治国：AI赋能4S售后转型，深耕本地化构建服务新生态

03-28

从“穿针引线”到“吹拉弹唱”，机器人灵巧手解锁多元应用新场景

新华网北京3月27日电穿针引线、吹拉弹唱、冲调咖啡……在2026中关村论坛年会现场，多款机器人展现了丰富的应用场景，它们的“心灵手巧”，背后是具身智能从“数据”到“大脑”，再往“本体”延伸的技术发展方向，机…

03-28

全新速腾S登场：以高品质基因开启A+级轿车市场新20年征程

03-28

小牛电动发布灵犀AIOS，两轮车开启智能化新赛道，骑行体验再升级

03-28

四川内江举办人工智能产业对接大会发布供需清单签约项目注入发展新动能

此次发布的应用场景需求清单有60项，覆盖了全省14个地市、15个“人工智能+”领域。会议期间还举行了人工智能产业对接会以及“进园区、进企业”专题活动，开展产业投资推介、人工智能项目路演、高校科研院所作人工…

03-28

华为Mate80 Pro Max风驰版开售：旗舰机首搭散热风扇，性能影像双在线

大家知道，华为在去年11月发布了Mate80系列旗舰手机，共带来了标准版、Pro、Pro Max以及RS非凡大师四款机型，引起了许多网友的关注。看到这个配置的时候机哥也愣了一下，因为过去主动散热风扇基本只出…

03-28

高通钱堃博鳌发声：2026智能体加速发展 6G助力AI多领域落地

03-28

具身智能万亿赛道启航：领军者共探数据与场景突围新路径

03-28

博鳌论坛上，vivo总裁揭秘：影像+AI如何重塑智能未来新生态

03-28

趋境科技ATaaS平台发布：以四大核心技术重构AI Token生产效能新范式

03-28

AI执行革命浪潮下，硬件如何成为连接虚拟与现实的关键桥梁？

03-28

全球首款170GHz光调制器亮相　中国电信“双千兆”引领光网新跨越

作为光网建设的主力军，中国电信将继续坚守“网络强国”使命，以“双千兆”战略为引领，持续筑牢光网底座、深化场景应用、推动技术融合，让高速、智能、普惠的光网成为数字中国的坚实底座，为数字经济高质量发展、人民美好生…

03-28

商管佳战略升级入驻杭州人工智能小镇开启智能化规模化发展新篇

近日，商管佳正式启动战略升级计划，将总部进驻杭州未来科技城中国人工智能小镇，依托人工智能产业高地优势，全面吸纳行业顶尖人才，为企业下一阶段高质量、快速度发展注入强劲动能。商管佳作为专注于商业管理与数字化服务…

03-28

智能收入破百亿大关中国电信AI+布局从终端到行业全面开花

目前，中国电信已打造超110个行业大模型和超350个行业智能体，形成覆盖工业、政务等15类行业AI应用标准范式，服务超3.7万家行业客户，把AI 能力转化为可规模化落地的产业价值。目前，息壤已汇聚新疆、…

03-28

点击查看更多 +

全站最新

跃进“天元架构”首发，3款轻卡新车型江宁下线开启绿色物流新篇

全新速腾S登场：以高品质基因开启A+级轿车市场新20年征程

2026款揽胜运动上市，配置“加减法”优化，百万级豪华SUV再添实力之选

第五代五菱宏光MINIEV萌趣登场！4.48万起售，续航配置全面升级

3月下旬紧凑型SUV市场升温五款新车将至哪款是你的菜？

小牛电动发布灵犀AIOS，两轮车开启智能化新赛道，骑行体验再升级

热门内容

本栏最新

全新速腾S登场：以高品质基因开启A+级轿车市场新20年征程

小牛电动发布灵犀AIOS，两轮车开启智能化新赛道，骑行体验再升级

铂智7上市前获科技大咖深度实测，OTA升级R7大模型未来可期

广汽丰田铂智3X一周年OTA：以老车主免费升级开启合资智电转型新路径

众智FlagOS 2.0重磅登场：八大技术突破，携手生态伙伴共筑智能体时代新基座

于柯鑫引领沃尔沃“超混”变革：以纯粹工程铸就安全智能全能之选

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.