滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Claude Opus 4.7口碑撕裂：跑分夺冠却遭用户集体控诉升级“翻车”

时间：2026-04-19 20:48:03 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

AI大模型领域再次掀起争议风暴，Anthropic最新发布的Claude Opus 4.7版本在专业社区引发两极分化评价。第三方评测机构Artificial Analysis公布的Intelligence Index榜单显示，该模型与GPT-5.4、Gemini 3.1 Pro并列全球第一，但用户端的实际体验却呈现截然相反的反馈态势。

开发者群体集中爆发的不满情绪指向三个核心问题：代码生成能力出现断崖式下滑，逻辑推理质量显著退化，以及使用成本隐性增加。Reddit平台上，一篇控诉新版本"严重倒退"的帖子获得超3000次点赞，多位开发者晒出对比测试结果，显示原本能稳定运行的代码重构任务在升级后频繁出错，测试通过率从94.7%暴跌至41.0%。

成本争议源于技术架构调整带来的连锁反应。新版本采用的分词器使相同文本的token消耗量增加35%，直接导致API调用成本上升。尽管官方维持每百万token单价不变，但实际使用费用显著提高。更令开发者愤怒的是，旧版本的控制参数在新版本中完全失效，部分用户反映更换模型后立即遭遇接口报错，工作流被迫中断。

交互方式的变化加剧了用户体验冲突。新版本被指"攻击性增强"，对模糊指令的容忍度大幅降低，拒绝执行存在歧义的请求。这种转变引发激烈讨论：支持者认为精确执行提升了专业场景可靠性，反对者则批评模型变得"固执难用"。官方回应称，这是将模型定位从"顺从助手"转向"专业同事"的战略调整。

在专业评测中，Opus 4.7展现出的优势同样显著。GDPval-AA测试显示其真实工作场景表现领先第二名79分，幻觉率下降25个百分点至36%。这种改进得益于模型更倾向于承认知识盲区而非编造答案。长文本处理能力也获得提升，在100万token上下文的MRCR v2测试中，新版本展现出更强的信息检索准确性。

技术改进与用户体验的矛盾在逻辑推理测试中暴露无遗。NYT Connections Extended基准测试显示，新版本在复杂谜题解答中的表现从94.7%骤降至41.0%，MRCR v2测试得分也下降46个百分点。这种波动反映出模型优化过程中的能力再分配现象——某些维度提升的同时，其他能力可能出现暂时性退化。

用户信任危机在社区持续发酵。有开发者整理出包含23项行为变化的迁移指南，指出参数调整、默认设置变更等技术细节都可能影响使用体验。Claude Code创建者Boris Cherny承认，为补偿增加的token消耗，已为所有用户提高速率限制，但具体数值未予公开。这种信息不透明进一步加剧了用户焦虑。

更多>同类资讯

2026北京亦庄人形机器人半马开跑！近四成自主导航，国际队伍首参赛

04-19

百万Token却让AI变“蠢”？Anthropic支招：五步破解上下文腐烂难题

04-19

长城魏建军直指魏牌营销短板，CEO赵永坡坦然担责承诺改进

04-19

AI评测信任危机：10行代码拿下SWE-bench满分主流基准集体“沦陷”

04-19

AI浪潮下的Z世代：高频使用却信任崩塌，爱恨交织的生存法则

04-19

从跌跌撞撞到一骑绝尘：人形机器人半马“进化史”的惊艳跨越

04-19

第一批学AI的大学生：在时代浪潮中摸索前行，迷茫与挑战并存

04-19

人形机器人半马趣事多：“无头战士”“披风侠”等奇葩选手齐亮相

04-19

钉钉陈航：AI时代企业大变革，文档中层或成过去式

04-19

荣耀“闪电”机器人半马包揽前三瑞声科技精密结构件助力技术突破

04-19

钢铁身影赛场狂奔：人形机器人半马赛的欢乐与思考并存

04-19

北京亦庄机器人半马赛场，“小短腿”机器人携奶瓶跑出科技新活力

04-19

2026中国人形机器人生态大会：跨城作业显实力，最新成果齐亮相

据了解，中国人形机器人生态大会被誉为机器人界“全明星阵容”的盛会，今年云集了宇树、乐聚、众擎、银河通用、睿尔曼智能、征和机器人、因时机器人等头部本体品牌及灵巧手及产业链核心企业，全方位展现了人形机器人的最新…

04-19

荣耀自研人形机器人“闪电”夺冠具身智能领域实力获验证

人民网深圳4月19日电 (记者王星)4月19日，2026北京亦庄人形机器人半程马拉松落幕，荣耀齐天大圣队自研人形机器人“闪电”以50分26秒(净用时)的成绩夺得冠军，成为手机终端厂商中首个在该赛事夺冠的品牌…

04-19

人形机器人与机器狗“组团”热舞，群体智能系统让多品牌协同成现实

新京报贝壳财经讯（记者张冰）4月19日清晨，2026人形机器人半程马拉松赛在北京亦庄准时开跑。 “这是首次公开展示不同品牌的机器人一起跳舞，这里面，动作既有整齐划一，又有‘人浪’和‘千手观音’的多机协同。”…

04-19

点击查看更多 +

全站最新

2026港股回购“降温”：估值修复、跨市分流与企业转型下的新逻辑

吉利银河M9黑金智曜版4月21日登场，首搭千里浩瀚H7方案开启智慧出行新篇

问界汽车工厂交付将成常态赛力斯布局智慧服务与移动服务车

东风奕派纳米01 Cross北京车展登场携手华为乾崑共启智能出行新篇

广汽昊铂S600北京车展盲订来袭，纯电增程双动力满足多元需求

岚图卢放：全球车市存量竞争下中国新能源技术或成破局“金钥匙”

热门内容

本栏最新

魏建军直言专属电动车平台难成气候归元平台或成高端市场破局关键

长城汽车发布魏牌归元S平台魏牌V9X开启预售冲击高端新能源豪华车市场

星耀7预售价11.28万起，电混四驱家轿实现低油耗与高性能双赢

龚宇北影节产业论坛畅谈：AI助力影视降本增效，开启高质量发展新局

华为云OfficeClaw来袭：打破AI办公困局，为企业打造专属AI协作团队

吉利i-HEV智擎混动发布，以AI大模型挑战日系，混动市场迎新变局

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.