滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

GPT-5发布：性能未超预期，用户更怀念GPT-4o

时间：2025-08-10 15:59:38 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

在科技界万众瞩目之下，OpenAI终于揭开了其最新力作GPT-5的神秘面纱，距离GPT-4的发布已经过去了两年半的时间。在此期间，OpenAI的首席执行官山姆·阿尔特曼不断通过各种渠道预告，吊足了业界的胃口。然而，这款备受期待的旗舰模型在初次亮相时，却并未收获一边倒的好评。

回顾GPT-4发布之时，业界其他参与者尚需费时半年甚至更久才能赶上OpenAI的步伐。但此次GPT-5的发布，并未与主流模型拉开明显的差距。在某些性能指标上，GPT-5甚至有所落后，比如在特定的基准测试中不敌马斯克的Grok 4以及新近发布的Claude Opus 4.1。在上下文长度的比较中，它也未能超越Google的Gemini 2.5 Pro。

普通用户的反馈更为直接且强烈，他们普遍感觉GPT-5相较于GPT-4o的性能提升并不明显，反而更加怀念熟悉的GPT-4o。在用户的强烈抗议下，OpenAI不得不做出妥协，重新为Plus用户上架了GPT-4o模型。

这似乎表明，即便是强大的OpenAI，也不得不面对缩放定律（Scaling laws）的局限性。模型规模的持续扩大，已无法像过去那样带来成比例的性能飞跃，迭代速度不可避免地放缓。

从GPT-4到GPT-5，中间相隔了29个月，但这次并未出现从GPT-3到GPT-4时的那种跨越式进步。为了填补这一空窗期，OpenAI在过去一年中平均每个月都会发布一款细分模型，包括强调推理能力的o系列、体积更小的mini型号以及性能更强的Pro版本。

与GPT-5强调可靠性和易用性相似，这些更新都是在性能增长日益昂贵和稀缺的背景下所做的工程创新。虽然模型变得更加好用和可靠，但惊喜感却越来越少。

值得注意的是，并非所有用户都需要如此强大的模型。事实上，大多数普通用户使用大模型仅仅是为了完成一些基础的问答，或者将大模型视为一个情感交流的伙伴。

ChatGPT是有史以来用户增长最快的应用之一，现在的周活跃用户已达到7亿，全球近十分之一的人口都是ChatGPT的用户。然而，在这些用户中，只有约2000万是付费订阅用户，更多的人使用的是免费的基础模型。

GPT-5目前已向所有用户开放。在ChatGPT中，最明显的变化是对话界面变得更加多彩，用户现在可以自定义对话气泡的颜色——但紫色仅限于Plus用户使用，Pro用户则能使用更为尊贵的黑色。这一变化让人联想到QQ会员的等级制度。

在性能方面，尽管GPT-5并未与竞争对手拉开显著差距，但它仍然是目前市面上性价比最高、能力最全面的模型之一。在中立评测平台LMArena的最新榜单中，GPT-5位列所有测评项目的第一，包括文本理解、编程、视觉等类别。

在发布会上，OpenAI明显更加重视行业落地应用。他们简要介绍了GPT-5的性能提升，而将更多的时间留给了GPT-5在编程、写作和医疗等特定行业的升级。特别是编程领域，发布会几乎有一半的时间都聚焦于此。

山姆·阿尔特曼在GPT-5发布后强调，GPT-5是他们迄今为止开发的最智能的模型，但他们更追求的是现实世界的实用性、大规模的可访问性和可负担性。GPT-5在减少幻觉、提升指令遵循能力和降低模型谄媚性方面取得了显著进展。

例如，在启用网络搜索的情况下，GPT-5出现事实错误的概率比GPT-4o降低了近一半。GPT-5也会更诚实地面对用户，能够更准确地识别无法完成的任务，并诚实地表达自己的能力局限。

然而，尽管GPT-5在可靠性和易用性方面取得了进步，但部分用户仍然对旧版模型情有独钟。他们习惯了GPT-4o的个性和互动方式，对于GPT-5的平淡风格感到陌生。

山姆·阿尔特曼在Reddit的问答活动中表示，他们已经听到了用户的反馈，并将为Plus用户重新开放GPT-4o模型的使用权限。这一决定或许能够暂时平息用户的不满，但OpenAI仍需要思考如何在保持模型性能提升的同时，满足用户对个性和情感的依赖。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

人形机器人热潮涌动：280亿融资后，赛道从技术炫秀转向实用落地

08-10

资深媒体人刘春微博账号遭禁言，曾兼任多校教授

08-10

自如“单方解约”风波不断，长租市场动荡中寻求自救新路

08-10

传媒高管刘春微博账号遭禁言，曾任多校兼职教授

08-10

东北雨姐久违更新微博，转发宠物互动内容后秒删引关注

08-10

英特尔Coretemp驱动成“孤儿”项目，Linux硬件监控面临挑战

08-10

招商基金经理翟相栋卸任，管理超80亿基金近一年半任期回报超110%

08-10

捷豹路虎2026财年Q1财报：营收下滑9%，税前利润大跌近半

08-10

百果园董事长谈水果高价：专注品质教育消费者，2024年加盟门店大幅缩减

08-10

哈根达斯1200亿天价易主，冰淇淋市场风云再起

08-10

青岛至杭州物流专线：山海相连，货运新速度见证双城繁荣！

08-10

MIM材料龙头东睦股份：华为折叠机铰链供应商，人形机器人部件新宠

而目前仍占绝大多数市场份额的传统的金属件生产工艺不是这样，金属加工是先做出一个金属毛胚，然后用车床、铣床、刨床、钻床等机床在毛胚上加工，形成需要的形状，后来又进一步发明了CNC，也叫数控机床，所有的精度控制…

08-10

2025快手短剧白皮书：市场规模破500亿，短剧精品化趋势明显

2024年用户规模半年增长率达14.8%，超七成用户形成规律性观看习惯，其中36.19%的用户每日观看，38.15%的用户每周观看多次，印证了短剧的高用户粘性。内容上，都市题材占比跃居首位，恋爱题材仍为核心，…

08-10

微软裁员1.5万引争议，CEO纳德拉愧疚表态，千亿美元豪赌AI未来

微软CEO萨提亚·纳德拉，是微软史上第三任首席执行官，他在官方博客中直面争议，袒露心声。他虽对裁员深表遗憾，但也向这些员工表达了诚挚感谢与祝福。在庆祝公司成立50周年之际，微软一面经历着大规模裁员带来的阵…

08-10

特斯拉Dojo项目骤停，马斯克止损布局自动驾驶未来？

第一堂课是算力的账本：Dojo峰值1.1 EFLOPS听上去漂亮，但每瓦性能只和英伟达H100持平，而台积电5纳米加InFO-SoIC的封装成本却高出四成，花一块钱只能买到英伟达七毛钱的性能。DensityA…

08-10

点击查看更多 +

全站最新

宇树科技王兴兴：公司正推进上市，预测人形机器人出货量将翻倍增长

机器人企业高管高薪提案引争议，投资人怒批：此举或为掏空公司

大电池高性价比手机推荐：三款天玑9400+手机成热门选择

新能源电池新生：从汽车心脏到城市充电宝的绿色转型

我国科学家黑科技助力，全固态锂电池难题获突破，电动车续航有望升级

全新威兰达未加长，2.0L混动定价17万，能否续写销量传奇？

热门内容

本栏最新

传媒高管刘春微博账号遭禁言，曾任多校兼职教授

东北雨姐久违更新微博，转发宠物互动内容后秒删引关注

哈根达斯1200亿天价易主，冰淇淋市场风云再起

青岛至杭州物流专线：山海相连，货运新速度见证双城繁荣！

MIM材料龙头东睦股份：华为折叠机铰链供应商，人形机器人部件新宠

2025快手短剧白皮书：市场规模破500亿，短剧精品化趋势明显

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.