谷歌公司近日宣布,对其旗下广受欢迎的Gemini 3人工智能大模型进行重大升级,重点强化了Deep Think(深度思考)模式在科学、编程、研究与工程领域的应用能力。这一升级被视为人工智能领域的重要突破,有望在全球范围内引发新一轮技术热潮。谷歌在官方声明中透露,新的Deep Think功能已通过Gemini 3系列应用向Google AI Ultra订阅用户开放,同时首次通过Gemini API向特定研究人员、工程师和大型企业提供早期访问权限。
据谷歌介绍,升级后的Deep Think模式具备将草图转化为可3D打印实体物品的强大能力。该系统能够精准分析图纸,对复杂形状进行建模,并生成适用于3D打印的制造文件。这一功能不仅简化了设计流程,还为制造业和原型开发领域带来了新的可能性。谷歌工程师表示,Deep Think的核心优势在于其处理边界模糊、数据不完整和目标函数复杂场景的能力,能够帮助研究人员和工程师更快地获得可验证的结论和可执行的方案。
在性能评估方面,Deep Think在多个权威基准测试中取得了突破性成绩。该模型在Humanity’s Last Exam(无工具版本)中达到48.4%的准确率,在ARC-AGI-2测试中取得经ARC Prize基金会验证的84.6%高分,并在Codeforces竞技编程平台上获得3455的Elo评级。这些成绩表明,Deep Think在学术推理、抽象归纳和工程算法实现等方面实现了全面提升。更引人注目的是,该模型在2025年国际物理和化学奥林匹克竞赛的笔试部分达到了金牌水平,并在凝聚态理论基准测试CMT-Benchmark中取得50.5%的成绩,显示出其跨学科科研问题的处理能力。
谷歌强调,Deep Think的升级不仅体现在性能提升上,更在于其应用场景的拓展。该模型现已能够处理物理直觉、化学结构推断、数学形式化表达和代码化求解等复杂任务,形成了完整的科研问题解决组合。这种能力使Deep Think从单纯的答题工具转变为能够参与真实科研和工程流程的专业推理引擎。谷歌DeepMind团队同时披露,基于Deep Think的研究型代理(如内部代号Aletheia)已具备通过自然语言验证器捕捉逻辑漏洞、触发重写或推倒重来的能力,这标志着人工智能向实际科研工作迈出了重要一步。
从技术实现角度看,Deep Think的核心突破在于其结构化推理过程和可扩展的推理算力。该系统通过迭代式推理在多个假设空间并行探索,并在“生成-验证-修正”的闭环中不断优化结果。这种机制使Deep Think能够处理传统AI模型难以应对的复杂问题。谷歌表示,此次升级不仅面向个人用户,更注重企业级应用。通过Gemini API,Deep Think可以轻松嵌入企业研发链条,支持数据分析、仿真建模、代码驱动物理系统建模和自动化实验设计等关键环节。结合其“草图到3D打印”等直观演示功能,Deep Think具备了引发技术传播和商业应用的双重潜力。
在竞争格局方面,谷歌的这一升级使其在与OpenAI的ChatGPT和Anthropic的Claude等产品的竞争中占据有利地位。Deep Think的专用推理模式定位和明确的应用场景,使其更容易吸引开发者和机构的关注。谷歌透露,此次升级是与Vertex AI早期计划联动推出的,旨在为企业用户提供更完整的人工智能解决方案。随着Deep Think功能的逐步开放,预计将在科研机构、制造业和工程领域引发新一轮的人工智能应用浪潮。










