ITBear旗下自媒体矩阵:

谷歌Gemini 3 Deep Think大模型升级:拓展应用范围,助力科研工程难题攻克

   时间:2026-02-13 08:48:47 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌近日宣布对旗下人工智能模型Gemini 3 Deep Think进行全面升级,推出专为科学、研究与工程领域设计的“推理模式”。这一更新旨在应对真实科研场景中普遍存在的复杂问题,包括边界模糊、解法多样以及数据不完整等挑战。开发团队由谷歌工程师与多领域科学家共同组成,通过跨学科协作优化模型性能。

新版Deep Think的扩展策略分为两个阶段。自当地时间2月12日起,Google AI Ultra订阅用户可通过Gemini应用直接使用该功能。同时,谷歌启动“早期访问计划”,通过Gemini API向特定研究人员、工程师及企业开放申请,首批用户将参与模型在专业场景中的测试与反馈。

在性能验证方面,谷歌公布了多项基准测试结果。数学领域,模型在终极人类考试(Humanity's Last Exam)中取得48.4%的准确率;算法推理测试ARC-AGI-2得分84.6%,成绩经ARC Prize Foundation认证;编程能力方面,Codeforces竞赛基准获得3455的Elo评级,并在模拟2025年国际数学奥林匹克竞赛中达到金牌水平。科学领域,模型在2025年国际物理与化学奥林匹克竞赛笔试部分均获金牌级表现,理论物理基准测试CMT-Benchmark得分50.5%。

谷歌强调,基准测试成绩仅是技术验证的一部分,实际应用价值才是核心目标。新版Deep Think已展现出辅助科研的潜力,例如帮助研究人员解析复杂数据集、为工程师提供物理系统建模的代码框架。通过Gemini API的开放策略,谷歌计划将技术能力精准输送至专业领域,优先满足高价值场景需求。

此次升级标志着谷歌在通用人工智能领域的布局进一步深化。与传统模型不同,Deep Think的推理模式更注重解决开放性问题,其设计理念与科研工作流程高度契合。随着早期访问计划的推进,模型将在更多垂直领域接受实战检验,其性能优化方向也将根据用户反馈动态调整。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version