GPT-5.4发布：AI电脑操作超越人类，白领岗位面临变革与挑战

时间：2026-03-08 18:26:01 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域再掀波澜，OpenAI最新发布的GPT-5.4模型引发行业震动。这款被官方定义为"专业工作领域最强效率模型"的新产品，首次将推理、编码与智能体执行能力整合到单一架构中，标志着AI技术从对话交互向任务执行层面的重大跨越。据测试数据显示，该模型在计算机操作任务中首次超越人类平均水平，在金融建模、法律文书等复杂场景展现出显著优势。

在计算机操作能力方面，GPT-5.4创造了行业里程碑。基于OSWorld-Verified评测体系的369项真实任务测试中，该模型取得75%的任务完成率，较人类72.4%的平均水平高出2.6个百分点。这项测试涵盖文件管理、网页浏览、多软件协作等办公场景，要求模型通过屏幕截图理解任务，并使用鼠标键盘完成操作。更值得关注的是，在GDPval专业评估中，83%的任务交付质量达到或超过人类专家标准，其中投行级电子表格建模的准确率较人类提升17%，法律文书生成效率提高40%。

技术整合带来突破性进展的背后，是OpenAI对人才战略的前瞻布局。今年2月，OpenClaw项目创始人彼得·斯坦伯格加入核心研发团队，其主导的智能体协作技术直接赋能GPT-5.4。这款被开发者戏称为"小龙虾"的开源项目，3月1日以24.5万颗GitHub点赞数登顶全球开发社区，其多智能体协作框架为GPT-5.4的原生电脑操控能力奠定基础。技术融合带来的成本优化同样显著，通过工具搜索算法改进，模型处理百万token的成本降低47%。

尽管在专业领域表现亮眼，GPT-5.4仍存在明显的能力边界。对比测试显示，其编程能力落后Claude Opus 4.6约15%，科学推理水平较Gemini 3.1 Pro存在差距，医疗健康领域甚至出现3.2%的准确率倒退。行业专家指出，当前模型在可控虚拟机环境中的优势，难以直接复制到开放现实场景。正如清华大学AGI实验室负责人分析："特定测试集的超越不等于全面智能化，真实办公环境存在无数变量，这是当前技术框架难以覆盖的。"

差异化竞争格局正在形成。Claude Opus 4.6凭借代码生成优势占据开发者市场，Gemini 3.1 Pro以多模态理解和超长上下文赢得内容创作领域，而GPT-5.4则深耕专业服务场景。价格体系进一步强化这种分化：GPT-5.4每百万token输入成本达30美元，是Claude的6倍、Gemini的15倍。这种定价策略反映技术路线差异——OpenAI选择优先保障模型性能，其他厂商则通过成本优化扩大用户覆盖。

活动现场发布了20个重点场景项目，涵盖清洁能源、战略性矿产、低空经济、人工智能、智慧医疗等前沿领域，18个场景项目现场签署合作协议。据了解，本次发布的20个重点场景项目分为3个综合性场景项目和17个高价值应…

打个不太恰当的比方：像素蛋糕等 AI 修图模式，本质上是在「照片上涂改」；而 AI 生图的模式，本质上是你向 AI「形容」照片里的人，再让AI 大模型重新画出新的图片。在雷科技看来，从技术的角度来说，用…

Codex三大更新：Agent插件、批注和Sites齐发，近10亿用户一夜解锁「全能分身」。这让人和Agent的协作模式从「你干完我再改」变成了「你干着我随手调」。一句提示词，Codex就能把任何产出变成…

IT之家 6 月 3 日消息，OpenAI 今天（6 月 3 日）发布公告，宣布进一步拓展 Codex 的使用场景，新增 6 个岗位插件，覆盖62 个应用和 110 项技能。用户可选中网站导航栏、投资论点中…

Macaron-A2UI 的训练过程也是诠释了 Mind Lab 上面的一系列理论：在 30B，235B 和 754B的大语言模型底座上，基于 MinT 平台，团队先使用基于 LoRA 的 SFT（监督微…

平台具备强大的数据监控与分析功能，能实时采集绿电供给、产氢量、气体纯度、能耗等关键参数，精准评估系统运行状态；在多电解槽组成的制氢阵列中，可快速隔离故障单元并重新分配任务，尽可能降低不良影响。当绿电制氢迈向…

作为中国固态电池产业化技术路线的提出者与实践者，安瓦科技专注于高安全、高比能全固态电池核心技术的研发，并已构建起覆盖动力电池、消费电池、储能电池、低空经济、机器人、智能具身及智算中心（AIDC）等多元应用场景…

IT之家 6 月 2 日消息，日前，英伟达 CEO 黄仁勋宣布，英伟达将与宇树科技联手推出新一代人形机器人参考设计“H2 Plus”。据中新社报道，宇树科技市场部总监黄嘉玮 2 日（今天）透露，该产品将于今…

依托全国首批交通运输领域首个港口国家级人工智能应用中试基地的综合优势，青岛港凭借全场景、全要素、全闭环的创新安全管控方案，获得行业专家与评委认可。港口作业具有点多、线长、面广、场景复杂、人机交叉作业频繁、风…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.