深夜,一位开发者正准备结束一天的工作,一条突如其来的消息却让他瞬间清醒——OpenAI正式发布了GPT-5.4模型。这位开发者激动得难以入眠,因为他一直在等待一款既能胜任代码任务,又具备广泛世界知识的模型,来作为其自主开发的OpenClaw系统的核心引擎。
现代科技的发展离不开代码的支撑,无论是计算机还是互联网,其基础架构都由代码构建。因此,代码能力被视为智能体(Agent)能力的关键支柱。一个优秀的智能体基座模型需要同时具备强大的代码能力、丰富的世界知识以及多模态理解能力。当这三个方面都达到顶尖水平时,该模型便有望成为最出色的智能体模型,当然,价格因素也不容忽视。
此前,Claude Opus 4.6因其出色的代码和世界知识能力,几乎成为了智能体模型的代名词。尽管其多模态能力稍逊于Seed 2.0和Gemini 3.1 Pro,但在许多场景下已足够使用。而GPT-5.3-Codex虽然代码能力出众,但世界知识匮乏,甚至不如GPT-5.2,导致其在规划能力上远不及Claude Opus 4.6。GPT-5.3-Codex的输出内容难以理解,非程序员出身的用户往往感到困惑。
这位开发者曾尝试将GPT-5.3-Codex接入OpenClaw系统,但结果令人失望。由于模型缺乏“人味”,沟通起来异常费劲。最终,他不得不放弃这一尝试,转而使用Claude Opus 4.6和Sonnet 4.6作为场景调用模型。然而,Claude的高昂成本让他倍感压力。Anthropic公司限制了Claude Max Plan额度的使用范围,导致OpenClaw无法享受订阅优惠,只能通过API调用,这对于预算有限的团队来说无疑是沉重的负担。
相比之下,OpenAI的态度更为友好。在Claude封禁OpenCode账号期间,OpenAI明确表示支持第三方工具调用Codex额度,成为少数允许直接登录使用的顶级模型之一。OpenAI还不断为Codex增加额度,进一步降低了使用成本。然而,GPT-5.2的代码能力不足,GPT-5.3-Codex又缺乏世界知识,让开发者陷入两难境地。
GPT-5.4的发布终于解决了这一难题。该模型在代码能力上与GPT-5.3-Codex持平,世界知识甚至超越了GPT-5.2,同时还支持订阅额度,20美元即可畅享。对于OpenClaw来说,这无疑是天选基座模型。开发者迫不及待地进行了测试,结果令人振奋。
在真实工作任务表现测试中,GPT-5.4 Thinking取得了83.0%的成绩,远超Claude Opus 4.6的78.0%和GPT-5.3 Codex的70.9%。在解决真实软件工程问题方面,GPT-5.4 Thinking以57.7%的成绩与GPT-5.3 Codex基本持平,展现了强大的代码能力。GPT-5.4在操作电脑能力测试中也以75.0%的成绩超越了Claude Opus 4.6的72.7%,且操作速度极快。
GPT-5.4还带来了几项重要更新。首先,其上下文窗口从40万token扩展至100万token,大大提升了智能体在执行复杂任务时的上下文理解能力。其次,GPT-5.4成为OpenAI首个内置原生计算机使用能力的主线模型,能够通过代码和视觉方式操控计算机,甚至根据屏幕截图发出鼠标和键盘命令。该模型还支持工具搜索功能,优化了上下文工程,减少了不必要的token消耗,降低了成本并提高了响应速度。
尽管GPT-5.4 Pro版本在各项性能上更为出色,但200美元的月费对于大多数用户来说过于昂贵。相比之下,GPT-5.4的定价更为亲民,输入输出每百万token的价格仅为Claude Opus 4.6的一半。目前,ChatGPT和Codex已支持GPT-5.4,开发者在Codex中进行了初步体验,发现其输出内容终于变得通俗易懂,甚至带有一些幽默感。
然而,OpenClaw尚未支持GPT-5.4的登录使用,这让开发者略感遗憾。他期待一觉醒来后,系统能够完成更新,让他有机会测试GPT-5.4在OpenClaw上的表现。社区中的其他用户也纷纷表达了期待之情,先行体验者普遍反馈效果良好。这位开发者坚信,GPT-5.4的加入将让OpenClaw的体验更上一层楼,对于尚未使用过OpenClaw的用户来说,现在正是尝试的最佳时机。











