ITBear旗下自媒体矩阵:

谷歌Gemini 3 Deep Think重大升级 数学编程出色 物理化学奥赛达金牌水准

   时间:2026-02-13 10:04:03 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布对旗下人工智能模型Gemini 3 Deep Think进行重大升级,推出专为科学、研究与工程领域设计的“推理模式”。此次更新旨在应对真实科研场景中普遍存在的复杂问题,例如边界模糊、解法不唯一以及数据不完整等挑战。开发团队由谷歌工程师与多领域科学家、研究人员共同组成,通过跨学科协作优化模型性能。

更新后的Deep Think显著扩大了应用范围。自当地时间2月12日起,Google AI Ultra订阅用户可通过Gemini应用直接使用该功能。同时,谷歌首次通过Gemini API向部分研究人员、工程师和企业开放“早期访问计划”,并设立申请通道招募测试用户,以收集实际应用反馈。

在性能提升方面,新版Deep Think在数学、算法与编程等高难度推理任务中表现突出。未借助外部工具的情况下,该模型在终极人类考试(Humanity's Last Exam)中取得48.4%的成绩;在ARC-AGI-2基准测试中达到84.6%,结果经ARC Prize Foundation验证;在Codeforces编程竞赛中获得3455的Elo评级;并在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水平。

除数理领域外,Deep Think在自然科学方面的能力也得到强化。测试显示,该模型在2025年国际物理奥林匹克与国际化学奥林匹克笔试模拟中均取得金牌级成绩,同时在理论物理相关的CMT-Benchmark测试中获得50.5%的得分,展现出跨学科推理的潜力。

谷歌强调,Deep Think的升级不仅关注基准测试分数,更注重推动实际科研与工程应用。例如,该模型可协助研究人员解析复杂数据集,或帮助工程师通过代码构建物理系统模型。通过Gemini API开放早期访问被视为关键一步,谷歌计划持续优化功能,使其更贴近专业领域的实际需求。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version