滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

谷歌重磅发布Gemini 3：推理能力跃升，多领域应用开启智能新体验

时间：2025-11-21 02:11:51 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

谷歌公司近日宣布，其最新人工智能模型Gemini 3正式面向全球用户开放体验。这款模型在推理能力、多模态理解和复杂任务规划方面实现重大突破，标志着AI技术进入全新发展阶段。作为继2.5 Pro之后的迭代产品，Gemini 3在多项核心基准测试中刷新纪录，展现出超越前代的综合性能。

在推理能力验证方面，Gemini 3 Pro以1501分的Elo评分登顶LMArena排行榜，在"人类终极考试"中取得37.5%的未工具辅助得分率，GPQA Diamond测试准确率达91.9%。数学领域表现尤为突出，MathArena Apex测试以23.4%的得分率确立行业新标杆。多模态处理能力同样亮眼，MMMU-Pro和Video-MMMU测试分别获得81%和87.6%的成绩，SimpleQA Verified基准测试以72.1%的准确率刷新事实核查纪录。

深度思考模式（Deep Think mode）的引入成为技术亮点。该模式在"人类终极考试"中将得分率提升至41.0%，GPQA Diamond测试准确率达93.8%，ARC-AGI-2基准测试在启用代码执行后取得45.1%的突破性成绩。这种跨越式提升使模型能够处理更复杂的逻辑推理和开放域问题，为科研、编程等高阶应用提供强大支持。

多模态整合能力实现质的飞跃。模型可同步处理文本、图像、视频、音频和代码五种数据类型，支持100万令牌的上下文窗口。实际应用场景中，用户可上传学术论文、视频教程或运动录像，模型能自动生成交互式学习卡片、可视化图表或训练计划。在烹饪领域，系统可识别多语言手写菜谱并整理成数字化食谱；运动分析功能则能通过视频识别技术短板，制定个性化训练方案。

开发者生态迎来重大升级。Google AI Studio、Vertex AI和全新智能体开发平台Antigravity同步开放Gemini 3接入。在WebDev Arena排行榜上，该模型以1487的Elo评分领跑零样本生成领域，Terminal-Bench 2.0终端操作测试取得54.2%的成绩，SWE-bench Verified编程智能体测试准确率达76.2%。第三方平台方面，Cursor、GitHub、JetBrains等已完成集成，支持开发者构建更复杂的交互界面。

智能体规划能力取得实质性进展。在Vending-Bench 2模拟自动售货机业务测试中，Gemini 3成功管理全年运营周期，保持工具使用和决策一致性，实现显著高于其他模型的回报率。实际应用场景包括邮件分类、旅行规划等复杂流程，用户可授权模型自主完成多步骤任务。Google AI Ultra订阅用户现已可通过Gemini Agent体验智能体服务，该功能将逐步扩展至更多谷歌产品。

安全体系构建成为研发重点。Gemini 3通过谷歌前沿安全框架的全面评估，在抗提示注入、网络攻击防护等方面表现优异。模型谄媚性显著降低，决策独立性增强。研发团队与英国人工智能安全研究所等机构展开合作，获得Apollo、Vaultis等第三方安全机构认证，相关技术细节已公开在模型卡文档中。

用户开放计划分阶段实施：Gemini应用用户、Search AI Mode订阅者及AI Studio开发者可立即体验基础功能；企业用户通过Vertex AI和Gemini Enterprise获得完整服务；深度思考模式预计在未来几周内向Ultra订阅用户开放。谷歌透露，Gemini 3系列后续模型正在研发中，将持续拓展AI应用边界。

更多>同类资讯

全球首条百万片级体全息光波导产线投产解锁AR设备大众化“最后一公里”

这标志着我国在消费级AR（增强现实）核心显示技术领域实现了重大规模化量产突破，解锁了高性价比AR眼镜和车载AR-HUD走向大众市场的“最后一公里”。目前，尼卡光学是国内首家实现全栈自主研发、规模化量产体全…

06-15

鸿蒙6到鸿蒙7全面升级：底层重构、AI进阶，国产操作系统开启新篇章

HarmonyOS 7 正式亮相之后，无数用户想要清晰看懂新版本相较于鸿蒙 6 到底做了哪些核心升级，从底层架构、AI 智能能力、UI 视觉交互、性能流畅度、分布式互联、安全隐私六大核心维度，全方位对比两代系…

06-15

MG 4X苏皖动态评鉴会收官：硬核实力圈粉，技术平权引领9万级纯电新风潮

06-15

上海国际技术展启幕，22国硬核科技亮相，人造血管会生长成焦点

06-15

上交会圆满落幕：人工智能领衔，技术成交项目数创新高

06-15

世技大赛倒计时100天：新增项目紧跟潮流新规则引领技能新方向

06-15

求是AI探索馆开业：沉浸式剧情引领，打造可生长的AI科普新空间

06-15

具身智能行业：数据共识下，硬件模型评测路径分歧尽显

06-15

中国太空算力加速部署 AI大模型未来有望在轨高效融合计算

在这一关键节点，中国也已迈出坚实步伐：2025年，中国在酒泉卫星发射中心使用长征二号丁运载火箭，成功将太空计算卫星星座首批一轨12颗卫星发射升空。目前，中国太空算力的轨道部署正在加速。随着太空算力的增加…

06-15

华为云“硅基黑土地”新战略：以全栈自研之力，推动AI深度融入千行百业

把原本割裂的训练和推理算力揉成一张网，让训练、推理、Agent 等多种负载可以在同一资源池里动态复用。在媒体见面会上，周跃峰说得很直白：华为云「不太在乎 Token 总量是多少」，也「不太在乎收入的总量是…

06-15

人形机器人密封硅胶：精准把控尺寸精度，适配多元工况需求

工业重载人形机器人，关节运动幅度大、负载高，在保证基础尺寸精度的前提下，预留合理形变空间，防止高负载下因尺寸过紧导致部件损坏；室内服务人形机器人，内部元件密集，对尺寸精度要求严苛，几乎无精度冗余，需严格按照图…

06-15

中国首批自研海洋工程柔性智能焊接机器人系统在津投用开启焊接新篇章

海油工程柔性制造智能机器人研究课题长陈欣介绍，项目团队攻克了变截面焊接坡口识别、复杂路径规划、智能焊接工艺参数匹配及自适应调节等多项技术难题，实现焊缝AI视觉识别、三维激光视觉智能组对、多层多道智能排道焊接…

06-15

摩根大通看好优必选：5000台出货目标成关键，机器人行情聚焦交付能力

相比目标价本身，更该看的变量是2026年能不能把工业人形机器人从“能演示、能试点”，推到“能交付、能复购、能算账”。如果这些变量往好的方向走，机器人会从“硬件销售”逐步变成“硬件+数据+场景方案”的生意；如…

06-15

青春与科技共舞！海淀东升科技园大学生音乐会奏响科创与文艺新乐章

东升镇相关负责人说，中关村科学城・东升科技园将持续聚焦青年需求，深耕文化创新、丰富人文业态，推动科创与文艺协同发展，助力青年与城市共成长，为区域高质量发展汇聚源源不断的青春动能。 “未来，中关村科学城•东升科…

06-15

线上交友新趋势：牵手APP引领潮流，助力年轻人寻觅真实情感连接

06-14

点击查看更多 +

全站最新

雷军盐城行体验早茶文化，商家紧跟潮流推出“同款”引关注

雷军盐城之行超暖心：尝街头小吃，给粉丝发麦芽糖尽显亲和力

MG 4X苏皖动态评鉴会收官：硬核实力圈粉，技术平权引领9万级纯电新风潮

重庆车展沃尔沃双旗舰登场，EX90与ES90纯电魅力解锁出行新体验

重庆车展大众安徽三车齐聚智能纯电矩阵成型服务生态同步升级

重庆车展长安“天枢领航”闪耀登场，十七年深耕铸就智能安全新标杆

热门内容

本栏最新

MG 4X苏皖动态评鉴会收官：硬核实力圈粉，技术平权引领9万级纯电新风潮

特斯拉重庆车展“亮剑”：智能汽车、机器人与补能网络共筑AI生态

理想汽车智源大会亮剑：自研马赫M100芯片破解AI推理难题性能跃升

长安汽车新突破：蓝鲸超擎混动量产天枢领航辅助驾驶系统发布

特斯拉2026重庆车展秀全场景生态：智能出行与基建助力山城新未来

长安“天枢领航”重构智驾安全逻辑：从“能用”到“敢用”的破局之道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.