滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

GPT-5.5“哥布林”成瘾背后：强化学习奖励机制闹的乌龙？

时间：2026-05-01 03:46:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近期，人工智能领域出现了一则引人关注的现象：OpenAI的GPT模型在对话中频繁提及“哥布林”“小妖精”等奇幻生物，这一情况引发了广泛讨论。研究人员发现，随着模型版本的迭代，这些词汇的出现频率呈上升趋势，甚至在部分场景中显得过于突兀。

事件的起点可追溯至GPT-5.1版本发布后。当时，用户反馈该模型在对话中表现得过于“自来熟”，安全团队随即展开调查。一位研究员在分析语言习惯时发现，模型频繁使用“goblin”“gremlin”等词汇，统计数据显示，“goblin”的提及量同比增长175%，“gremlin”增长52%。尽管初期现象并不显著，但几个月后，这类词汇的出现频率急剧上升，成为模型输出的显著特征。

进一步调查显示，问题与模型训练中的奖励机制密切相关。在GPT-5.4版本中，OpenAI发现，当模型被设定为“书呆子”（Nerdy）人格时，这类词汇的使用尤为普遍。该人格的系统提示要求模型以幽默、智慧的方式推广知识，并强调“世界复杂而奇妙，这种奇妙之处必须被承认、分析和欣赏”。尽管“书呆子”人格仅占ChatGPT总回复的2.5%，但66.7%的“哥布林”相关内容均由其生成。

研究人员通过对比强化学习训练数据发现，“书呆子”人格会对包含“goblin”或“gremlin”的输出给予更高评分，认为这类词汇能增加回答的趣味性。这种偏好逐渐形成了一种“反馈循环”：模型因使用特定词汇获得奖励，进而在更多场景中重复这一行为，最终导致词汇泛化至所有对话场景。即使在不具备“书呆子”特质的样本中，相关词汇的提及率也以相似比例增加，进一步验证了奖励机制的泛化效应。

为应对这一问题，OpenAI在GPT-5.4版本中直接弃用了“书呆子”人格，并在训练过程中移除了与奇幻生物相关的奖励信号，同时过滤了包含这类词汇的训练数据。然而，在后续的GPT-5.5版本中，“哥布林”现象不仅未消失，反而因根本原因未被彻底解决而更加严重。最终，OpenAI不得不在Codex系统提示词中明确禁止提及“哥布林”“妖精”“巨魔”等生物，以强制降低其出现频率。

尽管如此，部分用户对这一调整表示遗憾，认为随机出现的奇幻生物为对话增添了趣味性。为此，OpenAI提供了复活这些词汇的指令：用户可通过修改模型指令文件，移除相关禁令，从而恢复“哥布林”等词汇的使用。这一灵活处理方式既满足了技术需求，也兼顾了用户体验。

此次事件为人工智能训练提供了重要启示：奖励信号可能在不经意间塑造模型行为，并通过强化学习泛化至未预期的场景。OpenAI团队表示，他们已开发新工具用于审计模型行为，旨在从根源上修复类似问题，避免未来出现新的“意外词汇”现象。

更多>同类资讯

中央网信办启动4个月专项行动全面整治AI应用乱象规范行业健康发展

05-01

OpenAI披露“哥布林现象”成因：个性训练奖励意外放大模型语言偏差

05-01

GPT-5.5为何爱说哥布林？OpenAI笑着说出真相

05-01

巨日禄宣布与火山引擎达成深度合作 AI短剧进入“工业化”时代

05-01

刘烈宏：词元驱动AI变革，数据、基建、模式、生态共筑新未来

05-01

贵州借“东数西算”优势具身智能产业联盟与中试基地共促产业升级

05-01

AI与芯粒浪潮下，NoC架构如何平衡性能功耗与一致性难题？

05-01

中国电信柯瑞文：依托智能云体系推进Token经营赋能数智化转型

05-01

智云上海绘就AI新画卷：六大智惠应用赋能，匠心筑梦点亮“模都”未来

05-01

中国电信词元经营战略：以Token为钥开启智能时代数字要素运营新篇章

05-01

中国电信柯瑞文：构建智能云体系推动Token经营赋能AI服务新未来

05-01

AI赋能中国高端旅游：从工具升级为“礼宾”，让服务更有温度更贴心

05-01

GPT-5.5“哥布林”成谜？OpenAI公告揭秘模型行为“跑偏”真相

05-01

2026北京亦庄AI+产业大会：务实对接，共寻AI落地新场景与新机遇

05-01

中国电信柯瑞文：以智能云体系为基推动Token经营赋能AI服务新篇

05-01

点击查看更多 +

全站最新

我国物流规模领跑全球，现存物流相关企业超192万家

八部门出手规范金融网销，现存金融消费相关企业超44.8万家

高质量筑基楼市回稳，现存房地产相关企业超258.8万家

中国演出市场收入超837亿元，现存演出相关企业超100万家

高德途途亮相数字中国峰会：开放环境全自主，具身智能服务民生新典范

AI悟空助力雷科技：从繁琐到高效，媒体影响力报告一键生成！

热门内容

本栏最新

宇树科技双臂人形机器人亮相，2.69万元起售，灵活操作未来可期

乐道L80入局大五座SUV市场，李斌：纯电空白将被填补，销量或迎拐点

硬核技术赋能出行新体验吉利中国星i-HEV智擎混动双车引领混动新风潮

传统智驾遇瓶颈：规则局限难突破，端到端大模型成车企新赛道焦点

ChatGPT问世后：全球互联网新增内容超三成现AI生成痕迹

吉利中国星i-HEV智擎混动双车上市限时权益多动力配置亮点足

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.