滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

OpenAI研究人员：破解大语言模型“幻觉”难题，关键在调整评估标准

时间：2025-09-06 21:00:03 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

据《商业内幕》报道，OpenAI研究人员近日宣布，他们已找到破解大语言模型核心缺陷——"幻觉"问题的关键路径。这一发现直指当前主流模型普遍存在的信息输出失真问题，即模型将虚构内容当作真实信息呈现的弊端。

研究团队在最新论文中指出，现有训练机制导致模型倾向于"假装知情"。当面对不确定问题时，系统被优化为必须给出答案，而非承认知识盲区。这种设计源于评估体系对"完整回答"的过度奖励，使得模型在信息不足时仍会强行输出内容。

实验数据显示，不同模型在处理不确定性时存在显著差异。以Claude模型为例，其设计更注重回答准确性，当信息不足时倾向于拒绝作答。但研究人员同时指出，这种保守策略导致约30%的常规问题被搁置，可能影响用户体验。

论文核心观点认为，当前评估标准存在根本性缺陷。现有测试体系类似标准化考试，要求模型对每个问题给出明确答案。这种机制迫使系统将复杂现实简化为非此即彼的判断，而忽略了真实世界中普遍存在的模糊地带。

"人类通过实践学会区分确定与不确定的边界，但模型评估仍停留在应试阶段。"研究团队负责人表示，"当测试惩罚'我不知道'的回答时，系统自然会选择冒险猜测来获取分数。"

针对这一困境，研究人员提出评估体系改革方案。核心建议包括：建立不确定性量化评分机制，对谨慎回答给予正向激励；修改准确率计算方式，降低猜测行为的收益；引入多维度评估标准，替代单一正确率指标。

OpenAI在配套博文中强调，现有排行榜机制正在加剧问题。当模型发现侥幸猜中答案能获得排名提升时，训练过程就会强化这种投机行为。改革评估标准不仅能提升输出质量，还将推动模型向更接近人类认知的模式进化。

更多>同类资讯

文昌航天发射场再传捷报长征七号改成功送实践二十八号卫星入轨

12-01

神舟二十号舷窗现裂纹如何应对？在轨处置后将无人返回并获宝贵数据

12-01

从烤鸡翅到航天母舰：解锁太空生活与科技交织的无限魅力

12-01

神舟二十号舷窗现裂纹应急应对后将无人返回航天人迎难而上

12-01

神舟二十号舷窗现裂纹！应急处置后将无人返回航天人迎难而上

12-01

月球采样归来：解锁宇宙奥秘开启深空探索与资源利用新征程

12-01

国产大飞机新征程！东航C919今日起执飞上海至兰州高原定期航线

12-01

12月天象奇观来袭！超级月亮、双子座流星雨、星月童话精彩不断

12-01

拜耳光伏支架尺寸如何选？适配场景是关键，专业指导更安心

光伏发电支架是太阳能发电系统的重要组成部分，承担着支撑和固定光伏组件的关键作用。拜耳作为材料领域的知名企业，其生产的光伏支架在尺寸设计上充分考虑了不同应用场景的需求。光伏支架的尺寸参数主要包括长度、宽度、…

12-01

新能源绿篱修剪机：全地形覆盖，以智能创新解锁公路养护新场景

在公路养护的复杂地形挑战中，新能源锂电池车载式公路绿篱修剪机凭借创新的机械架构与智能算法，实现了从平原到山区的全场景作业覆盖，重新定义了“移动修剪”的技术边界。在山区公路的急弯路段，其搭载的陀螺仪稳定系统可…

12-01

2025年11月30日长征七号改火箭成功送实践二十八号卫星入轨

12-01

神舟二十号舷窗现裂纹二十二号携处置装置升空二十号将无人返回

12-01

荣信汇科拟赴港交所上市：上半年营收2.34亿净亏537万募资9.77亿布局多领域

12-01

英特尔"Wildcat Lake"处理器将推Refresh版新增4P+0E+4LPE CPU规格

12-01

周星驰版《鹿鼎记》4K修复版12月5日登陆内地，重温经典喜剧魅力

12-01

点击查看更多 +

全站最新

认知智能如何“顶天立地”？实验室副主任王士进揭秘AI未来图景

讯飞潮汐力携AI传感仪器亮相沃尔沃技术展，赋能汽车生产检测智能化升级

小米汽车11月交付量稳超4万台 602天达成50万辆整车下线新成就

雷军宣布小米汽车12月开启现车选购，严格质检保障，部分车型享优惠年底提车

小米汽车11月交付量破4万台大关，雷军致谢并表继续奋进决心

2025年11月小米汽车交付量持续破4万 50万辆下线创全球新能源车企新纪录

热门内容

本栏最新

牧原食品拟赴港上市：2025年三季度营收净利双降全年业绩分化明显

成都科服集团：以科技服务为笔绘就卫星互联网产业创新发展新画卷

全勤高效还省钱！揭秘汕德卡G7S燃气车一年回本25个月百万公里秘诀

全勤高效低气耗！汕德卡G7S燃气车25个月100万公里且一年回本

汕德卡G7S燃气车：高效运营的秘诀，一年回本25个月破百万公里

驾照新政来袭：“终身免检”与70岁以上考照，安全驾驶是关键！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.