滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

GPT-5.4重磅登场：整合多能力，开启AI完成任务新时代，但也有小烦恼

时间：2026-03-06 08:36:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI近日宣布推出全新一代模型GPT-5.4，这款模型将编程、推理、计算机操控、网页搜索及百万级Token上下文处理等多项能力整合于一体，在保持各项功能原有水准的同时，实现了性能的全面升级。这一突破性进展标志着AI应用从单一任务处理向复杂工作流整合迈出关键一步。

在知识工作领域，GPT-5.4展现出超越专业人士的实力。基于覆盖9个主要行业、44种职业的GDPval基准测试，该模型在财务建模、急诊排班、销售演示等实际工作场景中，83%的输出结果达到或超过行业专家水平。法律平台Harvey的测试显示，其在复杂法律文书处理中得分高达91%，较前代模型提升13个百分点。特别在电子表格建模任务中，初级投行分析师模拟测试得分从68.4%跃升至87.3%，错误率降低33%，完整回复错误概率下降18%。

编程能力整合成为开发者关注的焦点。新模型将Codex的编程功能无缝融入主线架构，在SWE-Bench Pro软件工程基准测试中取得57.7%的成绩，较前代提升2.1个百分点。实验性功能Playwright Interactive支持可视化实时调试，开发者可同步进行代码编写与应用测试。某博主使用该功能在24分钟内完成Minecraft克隆版开发，运行流畅无卡顿。沃顿商学院教授通过单条提示词生成三维空间场景的案例，直观展现了模型在复杂项目开发中的效率提升。

计算机操控能力实现质的飞跃。原生内置的操作系统交互功能使模型可直接处理截图输入，在OSWorld-Verified桌面导航测试中以75%成功率超越人类基准（72.4%）。物业税务表单自动填写系统部署案例显示，首次成功率达95%，会话速度提升3倍，Token消耗降低70%。这得益于模型支持的1024万像素高保真图像输入模式，以及256万像素高清模式的升级。

工具调用机制的创新带来显著成本优势。通过动态工具检索系统，模型在250项任务测试中减少47%的Token消耗，同时保持准确率不变。网页搜索持续性表现突出，BrowseComp基准得分82.7%，Pro版本更达89.3%，在复杂查询场景中展现出持续深挖信息的能力。某自动化平台CEO评价称，该模型在搜索深度和结果完整性方面树立了新标杆。

百万级Token上下文支持开启长文档处理新纪元。API接口现已支持100万Token输入，实际测试显示272K以下区间性能稳定，适合日常使用。某数学基准测试中，模型在50道研究级难题中取得38%正确率，较前代提升6.7个百分点，展示出处理复杂逻辑推理的潜力。不过超长上下文使用需注意成本问题，272K以上请求将按双倍配额计费。

交互体验革新体现在执行过程可控性增强。新增的"中途打断"功能允许用户在模型执行计划阶段介入调整，避免重复劳动。某科技公司创始人分享的案例显示，简单问候语触发过度推理导致高额消耗，提示用户需根据任务复杂度选择标准版或Pro版。这种灵活配置模式既满足轻量级需求，又支持高强度推理场景。

该模型已向ChatGPT高级用户开放，逐步替代原有思考模型。API定价体系区分标准版与Pro版，后者输入输出成本分别为30美元/百万Token和180美元/百万Token。批量处理享受五折优惠，优先处理则需支付双倍费用。这种差异化定价策略为不同规模企业提供灵活选择空间。

更多>同类资讯

智谱一边狂奔，一边失血

04-01

OpenAI将建造大型机器人研发设施

04-01

苹果CarPlay正式接入ChatGPT，iOS 26.4系统开启车载语音AI新体验

04-01

反对技术革新？苹果限制AI编程应用更新

04-01

Salesforce全面重塑Slack：AI助手Slackbot能力大增

04-01

新研究发现：全球大型数据中心产生“热岛效应”

04-01

消息称苹果iOS 27快捷指令应用将迎AI革命

04-01

Anthropic做了自己的OpenClaw，正式进入Claude Code

04-01

Claude Code逾51万行源码遭泄露

当地时间3月31日，被视为OpenAI最强竞争对手的Anthropic再次遭遇代码泄露事件，是其在一周内遭遇的第二起重大数据失误事件。

04-01

史上最严AI三大新规将落地！强制捆绑暗地扣费等乱象要终结了

04-01

新阿维塔12开启预售：全系搭载太行智控2.0技术+896线激光雷达

04-01

苹果iOS 27 Siri大更新：支持一次下达多个指令

04-01

智谱2025年收入7.24亿元，净亏损扩大至47.18亿元

04-01

成本太高，消息称英伟达AI芯片Rubin Ultra放弃4-Die封装方案

04-01

北斗走出独特技术路线，全球覆盖且性能精度超GPS，下一代建设规划出炉

4月1日消息，北斗卫星导航系统是我国自主建设、独立运行的卫星导航系统，是为全球用户提供定位、导航和授时服务的国家重要空间基础设施。据了解，2024年11月，纪念北斗卫星导航系统工程建设三十周年座谈会召开，会…

04-01

点击查看更多 +

全站最新

ETF风向标 | 创新药板块全线爆发，恒生创新药ETF、港股通创新药ETF涨超8%，黄金ETF单日“吸金”16.9亿

光明乳业解锁上海专属味道，"梧桐树下享浓上海"新品首发

美股异动丨名创优品盘前续涨超2% 旗下TOP TOY重新递表港交所

美股异动丨VCX盘前大涨超12%，美股三大“超级独角兽”IPO箭在弦上

黑芝麻智能营收三连增，智驾叠加具身智能放量，端侧AI打开成长空间

港股收评：4月开门红！恒指大涨2%，航空股起飞，石油股趴窝

热门内容

本栏最新

十年磨一剑启新程！吉利博越REV全球上市硬核实力开启A+级SUV新篇章

吉利博越REV杭州上市增程技术加持续航超1500km 售价10.79万起

范式智能2025年营收达71.35亿：AI业务增长显著，实现扭亏为盈

优必选2025年业绩亮眼：全尺寸人形机器人收入激增产能订单双领跑

吉利博越REV焕新登场续航强劲配置拉满十年热销再启新程

AI从“对话”迈向“做事”新阶段华为携手伙伴共拓行业数智新篇

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.