滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

GPT-5.4重磅上线：原生操控电脑，编程能力飙升，AI应用再进阶

时间：2026-03-06 09:19:55 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

OpenAI今日正式推出GPT-5.4系列模型，同步上线ChatGPT、API及Codex平台。作为首款具备原生计算机操作能力的通用大模型，GPT-5.4在电脑操控、知识工作、工具调用等核心场景实现全面突破，官方测评显示其综合性能显著超越GPT-5.2、Claude Opus 4.6及Gemini 3.1 Pro等主流模型。

在知识工作领域，GPT-5.4展现出显著优势。基于GDPval测试体系评估，该模型在44个职业场景中产出专业成果的能力达到行业专家水平的83%，较前代模型提升12.1个百分点。具体任务中，电子表格建模得分提升至87.3%，PPT生成效果获得68%的人类评审偏好，其视觉呈现与信息组织能力获得广泛认可。针对事实准确性问题，新模型将单个错误概率降低33%，整段回答错误率减少18%，成为OpenAI迄今最可靠的模型。

计算机操作能力是本次升级的核心亮点。GPT-5.4通过Playwright等库实现跨应用自动化操作，支持基于屏幕截图的鼠标键盘指令生成。在OSWorld-Verified桌面环境测试中，该模型以75%的成功率超越人类基准（72.4%），较GPT-5.2提升27.7个百分点。浏览器操作测试WebArena-Verified显示，结合DOM交互与视觉识别的混合模式使成功率提升至67.3%。视觉感知方面，新模型在MMMU-Pro基准测试中取得81.2%的准确率，文档解析误差率降至0.109，较前代优化29%。

针对高分辨率视觉处理需求，OpenAI推出双精度模式：原始精度模式支持最高1024万像素输入（最大边长6000像素），高精度模式支持256万像素（最大边长2048像素）。早期测试表明，高精度输入可显著提升模型的空间定位能力与图像理解准确性，在医疗影像分析等专业场景具有应用潜力。

编程能力方面，GPT-5.4继承并优化了Codex的代码生成优势。SWE-Bench Pro测试显示，新模型在复杂前端任务中的表现超越所有前代版本，开启/fast模式后token生成速度提升1.5倍。实验性功能"Playwright交互式"支持视觉化网页调试，开发者可实时测试Electron应用开发过程。某主题公园模拟游戏开发案例显示，该模型能通过简短提示词自动生成等距视角美术资源并完成浏览器端实机测试。

工具生态系统建设取得重要进展。API平台新增工具搜索功能，使模型在处理多步骤任务时能动态检索工具定义，减少30%的token消耗。Toolathlon基准测试表明，GPT-5.4完成邮件处理、文件上传、数据录入等跨平台任务的交互轮次减少40%，准确率提升至92%。网页搜索能力BrowseComp评分跃升17%，Pro版本达89.3%，可持续追踪多轮搜索结果并定位关键信息源。

商业化部署方面，GPT-5.4思考模式即日起向ChatGPT Plus、Team及Pro用户开放，原有GPT-5.2模式将保留至6月5日。Pro版本专为复杂任务优化，企业用户可获得优先处理权限。定价策略显示，新模型输入成本上涨超40%，输出成本增加7.14%，但官方强调更高的token效率可使多数任务总成本下降。Codex平台提供百万级上下文窗口实验支持，超出标准272K的请求按双倍额度计费，批量处理享受标准费率五折优惠。

行业分析指出，GPT-5.4的发布标志着AI从辅助工具向自主工作流引擎的转变。其原生计算机操作能力与专业场景适配性，使模型能直接参与数据分析、客户服务等高价值商业流程。随着工具生态系统的扩展，智能体在跨平台任务自动化领域的潜力将持续释放，可能重塑知识密集型行业的运作模式。

更多>同类资讯

美光CEO预测：L4自动驾驶普及汽车内存需求或迎超300GB时代

03-23

2025年度“中国十大气象科技进展”发布涵盖多领域创新成果

03-23

OpenAI加速扩张：年底前员工或翻倍，日均新增12人备战IPO

03-23

对话rabbit吕骋：AI硬件浪潮中坚守者，探索人机交互新未来

03-23

宇树IPO揭具身智能现状：行业冰火交织，突破之路任重道远

03-23

宇树科技冲刺科创板：年营收增超335% 人形机器人量产规模全球领先

03-23

OpenAI将启动美国ChatGPT免费版及Go版广告投放探索新收入路径

03-23

陶哲轩谈AI与数学：莫强行适配旧体系，应构建适配AI新“路”

03-23

春茶季新景象：“涪陵造”AI机器人助力茶区收茶高效又公平

在涪陵区蔺市街道五尧村的茶场里，4台新“上岗”的AI机器人正悄然改变延续多年的传统收茶模式——工人扫码、茶叶上秤，等级、重量、总价即刻打印，全程公平高效。这台“涪陵造”机器人的“智慧大脑”，来自智采慧收(重…

03-23

上海加速布局天基计算：太空算力中心与智能体共启未来产业新篇

上海正凭借产业链优势，加速构建天基计算产业生态：“千帆星座”等通信基础设施，在轨道空间搭建起数据传输的大动脉；中科天算等太空算力企业，为这条大动脉植入边缘计算节点，将单纯的通信网迭代为有算力输出能力的“空天算…

03-23

从沉浸式通信到“空天地海”全覆盖 6G如何重塑未来智能生活？

武刚进一步解读了这一变革：“未来6G网络的核心是融入智能的通信，基站可能成为融入通用GPU/FPGA/AI芯片的异构通算一体的边缘智能平台，核心网络也可能融入大模型，从单纯传输信号与交换路由的‘管道’，演变成…

03-23

东风日产NX8携天演架构2.0登场，大品牌大空间大智慧开启家庭出行新体验

03-23

变局中稳行致远，东风本田凭品质初心与创新韧性绘就合资新画卷

03-23

2026手机市场分化：多数品牌涨价，华为苹果缘何能“逆势而行”？

03-23

西湖大学“泰坦o1”发布：动作泛化大模型让机器人“分身有术” 领跑国际

03-23

全站最新

热门内容

本栏最新

东风日产NX8携天演架构2.0登场，大品牌大空间大智慧开启家庭出行新体验

变局中稳行致远，东风本田凭品质初心与创新韧性绘就合资新画卷

微博“硅基茶水间”上线：AI专属社交场人类“围观”新体验

启境品牌亮相：跨界融合赋能，首款GT7如何开启智能出行新境界？

陶哲轩谈AI辅助数学证明：别硬塞旧体系，应建适配机器新设施

智能经济浪潮下，高校双创教育如何破局与转型？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.