滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

DeepSeek V3.1模型陷“极”字Bug风波，数据质量成关注焦点

时间：2025-08-26 14:52:40 来源：机器之心Pro编辑：快讯 IP：北京 发表评论无障碍通道

近日，AI界发生了一起令人啼笑皆非的事件。DeepSeek，这一备受瞩目的AI模型，在其最新发布的V3.1版本中，意外地展现出了对汉字“极”的异乎寻常的偏爱。

上周，DeepSeek推出了V3.1-Base版本，尽管众多用户翘首以待的是V4版本。与此同时，V3.1版本已在网页、App及小程序等多个平台上线。然而，真实用户的测试反馈却带来了一个意想不到的问题：在模型的输出文本中，“极”字如幽灵般随机出现。

一位知乎用户Fun10165分享了她在使用火山引擎版DeepSeek V3.1整理物理试卷时的遭遇。她发现，模型的输出中莫名其妙地夹杂了许多“极”字，这一问题在后续测试中也持续出现，甚至在尝试通过官方API修复时也未能幸免。

不仅如此，其他用户也在不同平台上反映了类似的问题。有用户猜测，这可能是数据污染所致，即在模型训练过程中，某些包含“极”字的数据未被有效清洗，从而在模型输出中留下了痕迹。例如，有用户在使用不同版本的DeepSeek时，发现输出中不仅包含“极”，还有“极客园”、“极速赛车开奖直播”等字符串，这些都被认为是数据未清洗干净的证据。

Reddit上的讨论同样热烈。用户u/notdba在测试DeepSeek V3.1时，发现模型会在意想不到的位置输出“极”字及其相关词汇。他猜测，这一问题可能与多token预测（MTP）有关，当推理堆栈不支持MTP时，问题可能更加明显。

还有用户发现DeepSeek-V3.1存在多语言混用的问题。在中文翻译成俄语的过程中，模型会混合使用多种语言，包括英文和中文词汇。这一问题在不同提供商的OpenRouter上均有出现，进一步证实了数据污染的可能性。

面对这一尴尬局面，DeepSeek团队尚未给出官方解释。但这一事件无疑给所有AI模型开发者敲响了警钟：在追求高性能的同时，基础数据的质量同样至关重要。任何微小的数据污染都可能导致模型在实际应用中出现意想不到的偏差。

更多>同类资讯

春运首周“鹰眼守护”预警超11.4亿次累计护航340亿公里导航里程

02-09

当算力竞赛退潮，万亿增量的锚点正转向AI"深水区"

02-09

四大因素引爆芯片板块！科创芯片ETF(588200)标的指数持续上涨

02-09

"高市行情"杀回来了？日股狂飙，日元危机四伏

02-09

龙虎榜 | 超7亿资金杀入中文在线，成都系上榜！山东帮出逃浙文互联

02-09

ARC'TERYX始祖鸟2026全新Beta SV硬壳登场，为高山徒步筑牢专业防护屏障

02-09

杰富瑞：首次覆盖小马智行并给予"买入"评级

02-09

乘联分会：2026年轻型商用车新能源渗透率将继续提升

02-09

H&M创始家族斥资7500万瑞典克朗购入公司股份

02-09

包头稀土产品交易所：今日稀土主流产品价格整体上行

02-09

亚马逊与意法半导体就数据中心建设达成合作

02-09

新加坡1月外汇储备4170亿美元

02-09

央行：授权中国银行股份有限公司伦敦分行担任英国人民币清算行

02-09

2026年节前春运过半深圳铁路到发旅客超410万人次

02-09

国投白银LOF：将于2月10日开市起至当日10:30停牌

02-09

点击查看更多 +

全站最新

2026年钠电池蓄势待发：技术突破与场景落地双轮驱动产业突围

离岸人民币兑美元升破6.92，创2023年5月以来新高

美股异动丨腾讯音乐盘前续涨超1% 花旗料其上季业绩符预期或略胜预期

ETF视角下的A+H科技新图景

美股异动丨礼来盘前涨2.2% 高盛看高其目标价至1260美元重申 “买入”评级

美股异动丨文远知行盘前续涨超1% 与Uber合作拓中东市场获摩通看好

热门内容

本栏最新

ARC'TERYX始祖鸟2026全新Beta SV硬壳登场，为高山徒步筑牢专业防护屏障

离岸人民币兑美元升破6.92，创2023年5月以来新高

美股异动丨腾讯音乐盘前续涨超1% 花旗料其上季业绩符预期或略胜预期

ETF视角下的A+H科技新图景

美股异动丨礼来盘前涨2.2% 高盛看高其目标价至1260美元重申 “买入”评级

美股异动丨文远知行盘前续涨超1% 与Uber合作拓中东市场获摩通看好

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.