滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌推出基准测试检验AI：Gemini 3 Pro准确率仅69%

时间：2025-12-13 17:36:24 来源：IT之家编辑：快讯 IP：北京 发表评论无障碍通道

12 月 13 日消息，据《商业内幕》今日报道，谷歌 DeepMind 本周发布了 FACTS 基准测试，用来检验 AI 在事实准确性方面到底靠不靠谱。

这一测试从四个维度评估模型能力，包括是否能凭自身知识准确回答事实问题、能否正确使用网络搜索、是否能在长文档中扎实引用信息，以及对图像内容的理解水平。在参测模型中，谷歌的 Gemini 3 Pro 表现最好，准确率为 69%，其他主流模型则明显落后。

这一成绩对企业同样是个警钟。虽然 AI 在生成速度和语言流畅度上优势明显，但在事实可靠性方面仍然远低于人类标准，特别是在需要专业细分知识、复杂推理或严格基于原始材料的场景中。

报道指出，谷歌希望通过明确模型出错的位置和方式，加快 AI 的改进速度。但眼下可以得出的结论非常清楚，AI 确实在进步，然而仍有大约三分之一的时间会犯错。

更多>同类资讯

原特斯拉厂长宋钢首谈加盟小米汽车缘由，小米YU7及GT版发布引关注

05-22

理想汽车：从“移动的家”到具身智能，开启汽车行业新未来篇章

05-22

消息爆料：某厂7英寸2K大屏性能机工程机测试3nm天玑9系芯片，或为小米新机

IT之家 5 月 21 日消息，据博主 @数码闲聊站昨日爆料，某厂 7 英寸 2K 大屏性能机工程机至高测试 3nm 天玑 9系次旗舰芯片，电池确定会超 10000mAh。结合该博主此前的爆料习惯，预计该…

05-22

米家保温杯Ti2深度体验：199元享纯钛内胆，健康轻便的出行优选

如果说不锈钢保温杯是“刚需”，那么钛保温杯就是追求健康与品质生活的“进阶”；米家保温杯Ti2最大的亮点，在于“全钛杯体”设计，其钛纯度超过99%，这是整款产品最核心的价值基础。值得一提的是，这款杯子还贴心地…

05-22

小米发布会重磅登场：17 Max领衔，耳机手环及多款家电新品齐发

此外，小米17Max在音效、通信能力等方面也都是全面顶配，搭载大师级立体双扬声器、小米星辰通信系统，以全方位无短板的配置重新定义了「大屏标准版旗舰」。全新推出小米手环10 Pro，比上代续航更长、更轻薄耐…

05-22

2026上半年拍照手机新标杆！全焦段4K直出+AI玩法，人像拍摄新体验

在防抖能力上，这部手机同样配得上最强拍照手机推荐的称号。综上所述，无论从焦段覆盖、闪光人像、防抖能力还是AI创意玩法来看，这部2026年上半年发布的新机都毫无争议地站在了人像拍照的顶端。如果你想要一部随手…

05-22

大坪二手苹果手机怎么选？掌握5个验机技巧，避开陷阱选到靠谱好机

我的答案是：你的首要标准不是价格，而是这家店敢不敢把自己检测过的每一台机器的底裤都扒给你看。旧猫二手优品提供的15个月超长质保,坦白讲我在这个行业里第一次看到时有被震惊到。同行普遍是3到30天,旧猫直接拉到一…

05-22

景德镇吕蒙二手手机交易指南：五大平台深度测评助你选靠谱渠道

潜在短板：验机标准严格，小瑕疵易压价，部分机型报价略低于个人闲鱼交易；以回收 / 卖货为主有闲置数码 /奢侈品、追求安全透明、快速变现、重视隐私保护的用户2. 转转（二手买卖/回收场景）平台定位：综合型二手…

05-22

小米YU7对标Model Y十个月战况：八败两胜，成20万以上唯一赢过它的国产纯电车

发布会现场，雷军回应了小米YU7对标Model Y，他表示YU7首战ModelY八败两胜，但他觉得输给全球销冠不丢人，只要永不放弃，不断的改进，就一定会有赢的那一天。和特斯拉Model Y比，YU7十个…

05-22

雷军发布小米YU7 GT，纽北最速SUV诞生，YU7家族矩阵完整亮相

05-22

小米YU7 GT正式发布，售价38.99万元

05-22

等了半天Ultra ，为啥小米搞了个YU7 GT？

05-22

原特斯拉厂长宋钢回应加入小米：小米跟特斯拉非常像，其强项在于文化开放

05-22

唯品会：Q1净营收266亿元

05-22

网易：Q1营收306亿元，同比增长6.1%

05-22

点击查看更多 +

全站最新

小米YU7对标Model Y十个月战况：八败两胜，成20万以上唯一赢过它的国产纯电车

硬派越野新选择！北京越野BJ40增程长续航版上市开启长续航新时代

奕境汽车携X9亮相成渝大会扎根成都共促汽车产业高质量升级

马自达放缓电动化步伐转而加大混动车投入 2030年电动车占比或降至15%

103号赛级汽油亮相环塔拉力赛！普通家用车适用吗？一文读懂

动力电池与电机安全测试揭秘：底部球击电机性能如何严苛把关？

热门内容

本栏最新

小米YU7对标Model Y十个月战况：八败两胜，成20万以上唯一赢过它的国产纯电车

2026深圳：第十六届世界CMF大会启幕，共探具身智能与机器人CMF新未来

雷军谈保时捷反超：祝贺对手破纪录，小米将持续学习并争取再超越

纽北新王登基！小米YU7 GT 7分22秒755破纪录，雷军畅谈伟大旅程新体验

小米5年豪掷千亿研发！雷军再立宏愿：未来5年超2000亿加码技术新赛道

五一后内娱热闹非凡！一日五瓜齐飞绯闻道歉风波不断杨紫也陷争议

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.