滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

谷歌Gemini 3重磅登场，推理多模态能力超群，AI新纪元开启

时间：2025-11-19 05:13:28 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

谷歌最新发布的Gemini 3人工智能模型引发行业震动，这款被定位为"推理+多模态+智能体开发"三合一的旗舰产品，在基准测试中展现出惊人实力。OpenAI首席执行官萨姆·奥特曼在产品发布后迅速发布推文祝贺，侧面印证了这场技术突破的分量。据内部人士透露，奥特曼测试的可能是区分大小写的特殊版本，这暗示着模型对细微语义差异的精准把握能力。

在核心性能指标方面，Gemini 3 Pro创造了多项纪录：LMArena排行榜以1501分登顶，人类最后考试（HLE）取得37.5%的裸考成绩，GPQA Diamond测试斩获91.9%的准确率，MathArena Apex数学基准测试中达到23.4%的突破性表现。这些数据全面超越前代2.5 Pro，更将刚发布的GPT-5.1甩在身后。增强版的Deep Think模式在HLE和GPQA测试中分别达到41%和93.8%的优异成绩，ARC-AGI-2测试更以45.1%刷新历史纪录。

多模态处理能力是该模型的另一大亮点。MMMU-Pro测试获得81%的高分，视频理解基准Video-MMMU达到87.6%的准确率，SimpleQA Verified事实核查测试中取得72.1%的业界领先成绩。这些突破意味着模型能同时处理文本、图像、视频、代码等多种信息形态，在复杂场景下展现出博士级的推理水准。例如，该模型可以解析长视频内容，将学术论文转化为互动指南，甚至破译不同语言的手写食谱并生成数字化家庭菜谱。

在智能体开发领域，Gemini 3实现了质的飞跃。WebDev Arena排行榜以1487分强势登顶，Terminal-Bench 2.0终端操作测试获得54.2%的高分，SWE-bench Verified编码智能体测试达到76.2%的准确率。开发者演示显示，模型仅凭单个文本提示就能生成功能完整的3D乐高编辑器，包含复杂的空间逻辑和交互界面。更令人惊叹的是，它成功复现了经典iOS游戏《荒谬钓鱼》，包含音效和背景音乐，甚至构建出可运行的Game Boy模拟器并自动绘制设备外观。

长程规划能力测试中，Vending-Bench 2排行榜见证了模型在复杂商业场景下的决策实力。通过持续工具使用和策略调整，Gemini 3 Pro在模拟运营年度中实现更高回报率，展现出处理多步骤工作流的强大能力。实际应用场景包括自动预订本地服务、智能整理电子邮件等，用户只需把控方向即可由模型完成具体执行。

技术架构方面，该模型支持百万token的超大上下文窗口，整合了先进的推理引擎、视觉空间理解和多语言处理模块。训练过程完全基于谷歌TPU集群完成，展现出强大的硬件协同优势。开发者可通过Google AI Studio、Vertex AI、Gemini CLI等平台调用模型，第三方集成涵盖Cursor、GitHub、JetBrains等主流工具链。

伴随产品发布的还有革命性的智能体开发平台Google Antigravity。该平台将AI协作从工具层面提升至战略层面，开发者可以任务维度与智能体交互，通过专用界面同时访问编辑器、终端和浏览器。演示案例中，智能体自主规划并完成了飞行跟踪应用程序的端到端开发，包括代码编写、浏览器操作和结果验证等全流程。平台还集成了2.5代计算机使用模型和图像编辑组件，形成完整的开发生态系统。

更多>同类资讯

中国科研突破：激光驱动光子引擎助力6G，白光远传数据创纪录

05-26

零跑D99即将亮相粤港澳车展！舱驾一体+多种空间模式，中旬上市引期待

05-26

内存价格飙升下英伟达如何独善其身？CFO揭秘提前下单的“先见之明”

05-26

AI新锐Anthropic或本周完成超300亿美元融资估值有望跃居行业之首

05-26

华为“韬定律”破局后摩尔时代：从“空间压缩”到“时间压缩”的新路径

05-26

蚂蚁灵波与简智机器人携手共探高质量数据采集助力具身智能升级

05-26

AI浪潮下“小元件”大作为：MLCC如何从幕后走向台前引资本追捧？

05-26

铃木跨界新探索：MOQBA四足概念车，或重塑个人出行新未来

05-26

育碧《孤岛惊魂 7》秘密测试生成式 AI 遭曝光

05-26

打破手机跑大模型壁垒，面壁智能联合清华开源端侧新品BitCPM-CANN

05-26

百川智能发布 Baichuan-M4 大模型与“百小医”，AI 医疗从“咨询”转向“全科管家”

05-26

事实性幻觉率降至3.3%！百川智能将发布新一代医疗大模型Baichuan-M4

05-26

内存涨价不影响英伟达？CFO透露他们预判到价格会飙升早已提前下单

05-26

超过300亿美元！AI初创公司Anthropic新一轮融资最快本周完成

05-26

华为“韬定律”，真能改写芯片产业格局吗？

05-26

点击查看更多 +

全站最新

道奇Copperhead接棒Viper，大排量V8引擎加持，纯燃油旗舰跑车来袭

油耗低至3升多！吉利星越L与星瑞i-HEV混动版，经济科技双在线新选择

法拉利电动化里程碑之作Luce登场前苹果设计团队助力开启新篇章

极狐贝塔S3：以不到6万起售价杀入市场，合资中级车优势不再？

法拉利首款纯电Luce登场：设计颠覆传统，性能续航亮眼，2026年交付

2026款海狮06 DM-i焕新登场续航升级还配智能驾驶新功能

热门内容

本栏最新

零跑D99即将亮相粤港澳车展！舱驾一体+多种空间模式，中旬上市引期待

光互连成AI算力新战场，谢崇进携奇点光子如何抢占窗口期？

昇腾AI开发者峰会2026北京启幕：共探前沿技术，携手开发者共筑AI新未来

支付宝AI支付再突破：3亿笔交易达成，AI钱包与Token Pay引领支付新篇章

零跑D99即将粤港澳车展首秀，舱驾一体设计+多样空间模式，中旬上市引期待

华策影视否认解散电影部门传闻内容战略升级推进影视与AI融合

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.