滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

阿里千问APP公测对标ChatGPT 却在9.9与9.11大小上“栽跟头”后纠错

时间：2025-11-17 19:23:59 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

一场关于小数比较的简单数学题，意外成为检验人工智能大模型能力的试金石。当被问及“9.9和9.11哪个更大”时，多个知名AI模型接连出现判断失误，引发行业对技术局限性的深入讨论。这场测试最初由艾伦研究机构成员林禹臣在社交平台曝光，他发现ChatGPT-4o将13.11判定为大于13.8，随后Scale AI工程师通过变换问法，对多个主流模型展开测试，结果显示多数模型均未能正确回答“9.9与9.11的大小关系”。

第一财经近期针对阿里巴巴最新公测的千问APP展开测试，发现该模型在首次回答中同样出现错误。面对“数字9.9和9.11谁大”的提问，千问APP初始回答称“9.11更大”，但在后续问题拆解中，模型承认存在思维陷阱，并经过分析修正为“9.9大于9.11”。当被追问前后答案矛盾时，千问解释称首次回答存在“阶段性错误”，结论与推理过程不匹配，同时承认“9.11”的三位数形式可能引发数字长度错觉，导致认知偏差。经过自我溯源与纠错，千问在第三次提问中给出了正确答案。

这一现象折射出大模型在基础能力上的潜在短板。有技术从业者指出，当前主流模型本质仍是语言模型，其训练方式依赖语言数据的统计相关性，而非严格的规则学习。这种特性使模型在处理需要归纳推理的常识性问题时表现不稳定，即便能解决复杂数学竞赛题，仍可能在简单逻辑判断上“翻车”。例如，谷歌Gemini Advanced和Claude 3.5 Sonnet等头部模型，此前也曾在此类测试中集体失误。

尽管存在局限性，中国大模型在全球市场的竞争力正逐步显现。以阿里巴巴Qwen系列为例，其全球下载量已突破6亿次，并在技术生态与商业应用层面取得突破。爱彼迎CEO布莱恩·切斯基公开表示，公司已广泛采用Qwen模型，因其“速度快、成本低”，而OpenAI的最新模型在实际生产中因经济性不足未被大规模使用。这种技术优势正推动中国模型加速出海，与国际巨头展开直接竞争。

阿里巴巴近日宣布全面推进“千问”项目，正式进军消费级AI市场。基于开源模型Qwen3，千问APP计划整合地图、外卖、订票、办公、学习等生活场景，构建一站式智能服务平台。公司管理层将此视为“AI时代的关键战役”，试图借助Qwen的海外影响力，在通用人工智能领域开辟新赛道。这一布局不仅体现技术自信，更标志着中国AI企业正从应用创新向底层技术竞争升级。

更多>同类资讯

北京人形机器人创新中心开源XR-1大模型，助力国内机器人迈向真实场景应用新高度

12-20

贵州大学团队发布全球最大天文AI数据集ADAM 开启“人工智能+天文”新篇章

12-20

岚图汽车L3级自动驾驶实测11万公里全球首个智能架构赋能泰山新车型

12-20

上海交大陈一彤团队突破：全球首枚大规模全光生成式AI芯片问世

12-20

中国气象局雄安发布“风源”模型自主技术赋能全球气象预报

12-20

“90后”团队逐梦星辰：从失败到成功造出世界首颗木质外板验证卫星

这颗“年轻”的立方星背后是主要由9位青年组成的“造星”团队，中山大学“90后”博士后王辉是团队的负责人，这个关于宇宙和星辰的梦，他做了22年。怀揣着对浩瀚宇宙的向往，王辉在哈尔滨工业大学求学的岁月里，逐渐读…

12-20

受存储芯片价格上涨影响明年全球智能手机平均售价预计将上涨近7%

12-20

智谱冲刺港股：全球大模型第一股能否诞生？行业将迎关键“试探”

12-20

华为云零售峰会2025：Data+AI赋能，携手伙伴共绘智能零售新蓝图

华为云坚持与客户、伙伴携手共进，并为零售行业提供了安全稳定高质量的云底座、基于知识湖的数据平台、全栈的AI能力以及跟伙伴一起打造的、面向零售行业的解决方案和咨询服务等能力，同时在数智化营销、数智化供应链、数…

12-20

易讯数据郑士进：大数据与AI融合，为外贸企业铺就智能高效发展路

12-19

葛卫东投资版图再扩容：沐曦盈利亮眼，五一视界启动港股招股

12-19

中国气象局发布“风源”模型助力气象预报与科研迈向新高度

12-19

研发筑基全链赋能：晶存科技打造高速存储坚实技术支撑体系

12-19

北京人形开源具身小脑大模型助力机器人“知行合一”应对复杂场景

12-19

千问辟谣AI生成大会图，网友玩梗互动展现中国AI生态开放松弛

12-19

点击查看更多 +

全站最新

智元机器人引领变革：上海数采中心助力 5万元家用机器人未来可期

销量低迷的飞度迎来改款，外观运动配置升级，能否在新能源浪潮中逆袭？

从传统到创新：我军兵棋推演系统在智能赋能下开启人机协同新篇章

新国标下电动自行车行业“大洗牌”：告别低价，从达标迈向超标新赛道

复星与比亚迪强强联合共绘“出行+度假”融合生态新蓝图

本田海外发布2026款NX500探险车，电子离合+多改装套件引国产期待

热门内容

本栏最新

岚图汽车L3级自动驾驶实测11万公里全球首个智能架构赋能泰山新车型

华为云零售峰会2025：Data+AI赋能，携手伙伴共绘智能零售新蓝图

2025互联网“泔水”泛滥：AI内容成灾，真实创作何去何从？

福特智趣烈马新能源SUV上市！22.98万起享10大权益，配置拉满

2025万卡AI集群建设论坛启幕，全产业链共绘智算基础设施新蓝图

比亚迪1500万辆新能源车下线！腾势N8L以“两王三超”实力引领高端出行新潮流

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.