ITBear旗下自媒体矩阵:

GPT-5发布:性能未超预期,用户更怀念GPT-4o

   时间:2025-08-10 15:59:38 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在科技界万众瞩目之下,OpenAI终于揭开了其最新力作GPT-5的神秘面纱,距离GPT-4的发布已经过去了两年半的时间。在此期间,OpenAI的首席执行官山姆·阿尔特曼不断通过各种渠道预告,吊足了业界的胃口。然而,这款备受期待的旗舰模型在初次亮相时,却并未收获一边倒的好评。

回顾GPT-4发布之时,业界其他参与者尚需费时半年甚至更久才能赶上OpenAI的步伐。但此次GPT-5的发布,并未与主流模型拉开明显的差距。在某些性能指标上,GPT-5甚至有所落后,比如在特定的基准测试中不敌马斯克的Grok 4以及新近发布的Claude Opus 4.1。在上下文长度的比较中,它也未能超越Google的Gemini 2.5 Pro。

普通用户的反馈更为直接且强烈,他们普遍感觉GPT-5相较于GPT-4o的性能提升并不明显,反而更加怀念熟悉的GPT-4o。在用户的强烈抗议下,OpenAI不得不做出妥协,重新为Plus用户上架了GPT-4o模型。

这似乎表明,即便是强大的OpenAI,也不得不面对缩放定律(Scaling laws)的局限性。模型规模的持续扩大,已无法像过去那样带来成比例的性能飞跃,迭代速度不可避免地放缓。

从GPT-4到GPT-5,中间相隔了29个月,但这次并未出现从GPT-3到GPT-4时的那种跨越式进步。为了填补这一空窗期,OpenAI在过去一年中平均每个月都会发布一款细分模型,包括强调推理能力的o系列、体积更小的mini型号以及性能更强的Pro版本。

与GPT-5强调可靠性和易用性相似,这些更新都是在性能增长日益昂贵和稀缺的背景下所做的工程创新。虽然模型变得更加好用和可靠,但惊喜感却越来越少。

值得注意的是,并非所有用户都需要如此强大的模型。事实上,大多数普通用户使用大模型仅仅是为了完成一些基础的问答,或者将大模型视为一个情感交流的伙伴。

ChatGPT是有史以来用户增长最快的应用之一,现在的周活跃用户已达到7亿,全球近十分之一的人口都是ChatGPT的用户。然而,在这些用户中,只有约2000万是付费订阅用户,更多的人使用的是免费的基础模型。

GPT-5目前已向所有用户开放。在ChatGPT中,最明显的变化是对话界面变得更加多彩,用户现在可以自定义对话气泡的颜色——但紫色仅限于Plus用户使用,Pro用户则能使用更为尊贵的黑色。这一变化让人联想到QQ会员的等级制度。

在性能方面,尽管GPT-5并未与竞争对手拉开显著差距,但它仍然是目前市面上性价比最高、能力最全面的模型之一。在中立评测平台LMArena的最新榜单中,GPT-5位列所有测评项目的第一,包括文本理解、编程、视觉等类别。

在发布会上,OpenAI明显更加重视行业落地应用。他们简要介绍了GPT-5的性能提升,而将更多的时间留给了GPT-5在编程、写作和医疗等特定行业的升级。特别是编程领域,发布会几乎有一半的时间都聚焦于此。

山姆·阿尔特曼在GPT-5发布后强调,GPT-5是他们迄今为止开发的最智能的模型,但他们更追求的是现实世界的实用性、大规模的可访问性和可负担性。GPT-5在减少幻觉、提升指令遵循能力和降低模型谄媚性方面取得了显著进展。

例如,在启用网络搜索的情况下,GPT-5出现事实错误的概率比GPT-4o降低了近一半。GPT-5也会更诚实地面对用户,能够更准确地识别无法完成的任务,并诚实地表达自己的能力局限。

然而,尽管GPT-5在可靠性和易用性方面取得了进步,但部分用户仍然对旧版模型情有独钟。他们习惯了GPT-4o的个性和互动方式,对于GPT-5的平淡风格感到陌生。

山姆·阿尔特曼在Reddit的问答活动中表示,他们已经听到了用户的反馈,并将为Plus用户重新开放GPT-4o模型的使用权限。这一决定或许能够暂时平息用户的不满,但OpenAI仍需要思考如何在保持模型性能提升的同时,满足用户对个性和情感的依赖。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version