ITBear旗下自媒体矩阵:

谷歌Gemini 3 Deep Think升级!姚顺宇助力,科研工程难题迎刃而解

   时间:2026-02-13 21:34:35 来源:快讯编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布,其人工智能大模型Gemini 3迎来重大升级,推出专用推理模式Deep Think。该模式在多个高难度学术基准测试中刷新纪录,全面超越竞争对手Claude Opus 4.6和GPT-5.2,同时在科学研究和工程应用领域展现出强大实力,成为当前最先进的AI推理工具之一。

在测试中,Deep Think模式表现尤为突出。在"人类终极测试"中,该模型以48.4%的成绩创下新纪录;在ARC-AGI-2基准测试中取得84.6%的高正确率;在竞技编程平台Codeforces的Elo评分达到3455分;更在2025年国际数学奥林匹克竞赛模拟测试中达到金牌水准。该模型在物理、化学等科学领域的测试中也全面领先,包括在国际物理和化学奥林匹克竞赛笔试环节均取得金牌成绩,在凝聚态理论基准测试CMT-Benchmark中获得50.5%的成绩。

谷歌强调,Deep Think模式的研发不仅追求学术突破,更注重实际应用价值。该模式能够协助研究人员解析复杂数据,帮助工程师通过代码构建物理系统模型,特别擅长处理缺乏明确指导原则或数据不完整的问题。例如,在工程领域,Deep Think可将设计草图自动转化为3D打印文件,完成从图纸分析到三维建模的全流程,用户只需将生成的文件输入打印机即可获得实体模型。

在科学研究方面,Deep Think已展现出独特优势。该模型能够识别高专业度数学论文中人工评审未发现的细微逻辑缺陷,还可优化复杂晶体生长的制备方法。在杜克大学的实验中,Deep Think设计的方案成功培育出尺寸超过100微米的薄膜,技术指标超越所有现有方法。谷歌研发主管利用该模式加速物理组件设计,进一步验证了其在工程领域的实用性。

目前,Deep Think模式主要面向Google AI Ultra订阅用户开放,同时允许科研人员、工程师和企业申请参与早期测试。这一升级标志着AI推理大模型向专业化方向迈出重要一步,为解决科研和工程领域的复杂挑战提供了新的强大工具。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version