谷歌DeepMind近日推出全新人工智能模型Gemini 3 Deep Think,凭借其强大的推理能力在科技圈引发广泛关注。这款模型被视为当前最擅长解决复杂数学和科学问题的AI系统,甚至被部分开发者称为"推理能力的新标杆"。测试数据显示,该模型在Humanity’s Last Exam基准测试中取得41%的得分,在ARC-AGI-2测试中更以45.1%的成绩刷新行业纪录。
与前代产品相比,Gemini 3 Deep Think的核心突破在于采用"并行推理"技术。这项创新使模型能够同时探索多种解决方案路径,显著提升对复杂问题的处理效率。在3D场景生成任务中,该模型展现出惊人的细节还原能力——根据博物馆屋顶草图创建的交互式场景,不仅实现近乎1:1的视觉复刻,光影变化更完全符合物理规律。这种能力在多米诺骨牌游戏关卡设计中同样得到验证,模型不仅设计出富有创意的布局,还精准模拟了骨牌碰撞的物理效果。
开发团队通过多个对比实验展示模型优势。在创建程序化生成地球类行星的任务中,Deep Think版本展现出更强的创造力,其生成的3D模型在纹理细节和动态效果上明显优于普通版本。另一个测试中,模型仅凭一张玻璃瓶照片就生成了软橡胶材质物体坠落的3D动画,物体变形和反弹轨迹都符合真实物理规律。这些案例引发开发者社区热烈讨论,有专家认为按此发展速度,通用人工智能(AGI)的实现时间可能比预期更早。
谷歌同步宣布在新加坡组建精英研发团队,由知名华人科学家Yi Tay领衔。这支专注于高级推理和大语言模型研究的团队,将与山景城总部由Quoc Le领导的金牌团队形成协同效应。新团队成员阵容堪称豪华,包括思维链技术开创者Xuezhi、生成式检索发明人Vinh Q. Tran等顶尖人才。公司高层透露,该团队将直接参与Gemini系列模型的迭代开发,重点突破复杂推理和跨领域知识整合能力。
市场数据反映出技术竞争的激烈态势。Similarweb最新统计显示,Gemini系列网页端访问量达13.51亿次,11月环比增长14.3%,市场份额突破15%关口。与之形成对比的是,ChatGPT访问量降至58.44亿次,这是该平台年内第二次出现环比下滑。值得注意的是,在Cloudflare宕机事件中创下单日2.33亿次访问纪录后,ChatGPT仍未能逆转流量下降趋势。另一竞争者Grok则保持增长势头,11月访问量达2.344亿次,连续两个月刷新历史纪录。
技术社区对Gemini 3 Deep Think的实测反馈持续涌现。有开发者尝试用模型解决微分方程组,发现其解题步骤不仅正确,还能提供多种验证方法。在化学分子结构预测任务中,模型准确推断出复杂有机物的三维构型,相关结果已通过专业软件验证。这些案例表明,该模型在STEM领域的突破可能重塑科研工作流程。谷歌官方表示,Deep Think版本现已向Gemini App的Ultra用户开放,后续将根据用户反馈持续优化模型性能。











