ITBear旗下自媒体矩阵:

谷歌Gemini 3 Deep Think重大升级 数学编程科学多领域能力再跃升

   时间:2026-02-13 07:55:36 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布对旗下Gemini 3 Deep Think模型进行重大升级,推出专为科学、研究与工程领域设计的"推理模式"。这一更新旨在突破传统AI在复杂问题处理上的局限,为科研人员提供更强大的工具支持。新版本由谷歌工程师与多领域科学家联合开发,重点解决真实科研场景中数据不完整、问题边界模糊等挑战。

在技术能力方面,新版Deep Think展现出显著提升。该模型在终极人类考试(Humanity's Last Exam)中取得48.4%的成绩,在ARC-AGI-2基准测试中达到84.6%(经ARC Prize Foundation验证),Codeforces编程竞赛基准获得3455的Elo评分。更引人注目的是,其在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水平,在物理和化学奥赛笔试部分同样取得金牌级表现,理论物理基准测试CMT-Benchmark得分50.5%。

此次升级的另一重要突破是应用范围的扩展。从当地时间2月12日起,Google AI Ultra订阅用户可通过Gemini应用直接使用新功能。同时,谷歌通过Gemini API向特定研究人员、工程师和企业开放"早期访问计划",相关申请入口已在官方平台上线。这种分阶段推广策略既保证了技术稳定性,也为专业用户提供了优先体验机会。

谷歌特别强调,Deep Think的研发目标超越单纯追求测试分数。该模型被设计为科研人员的"智能助手",能够协助解释复杂数据集、通过代码构建物理系统模型等实际任务。例如在材料科学领域,研究人员可利用其处理实验数据中的噪声信息;在工程设计中,工程师能借助其快速验证不同参数组合的可行性。这种将理论能力转化为实用工具的定位,标志着AI技术向专业领域深度渗透的新趋势。

技术实现层面,新版本通过改进推理架构和知识表示方法,显著提升了处理不确定性问题的能力。针对科研数据常有的缺失值和异常值,模型开发了专门的容错机制;对于开放性问题,则采用多路径探索策略生成多样化解决方案。这些特性使其在气候建模、基因分析等前沿领域展现出应用潜力,部分合作机构已开始将其用于实际研究项目。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version