ITBear旗下自媒体矩阵:

谷歌Deep Think八语奥赛展实力 破科研语言壁垒 驱动多领域新发现

   时间:2026-04-08 13:55:39 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

谷歌DeepMind团队近日宣布,其研发的AI系统Deep Think在多语种学科竞赛中取得突破性进展,成功跨越语言与学科的双重壁垒。该系统以单一模型架构同时完成八种语言的竞赛任务,在数学、编程、物理等领域均展现出接近人类顶尖水平的推理能力,标志着AI驱动科研进入全新阶段。

在数学竞赛领域,Deep Think的表现尤为亮眼。该系统不仅在2025年国际数学奥林匹克竞赛(IMO)中以35分达到金牌标准,更在2025年第35届日本数学奥赛本选(JMO Finals)和第41届中国数学奥林匹克(CMO)中分别获得满分和86.3%的高分。值得注意的是,JMO成绩甚至超越当届80%的参赛选手,达到官方认定的"金奖相当"水平。法语竞赛中,Deep Think同样以满分成绩展现其跨语言推理能力。

编程竞赛领域,Deep Think在ICPC亚洲日本初赛中获得满分,Codeforces竞赛编程Elo评分达到3455分,这一成绩已接近人类顶尖程序员的水平。但在2025年中国信息学奥赛(NOI)中,该系统仅取得63.3%的成绩,暴露出AI在算法设计与工程实现方面的局限性。研究人员指出,数学竞赛侧重抽象推理,而编程竞赛需要同时具备推理能力、算法设计和工程实现能力,这对当前AI系统仍是挑战。

除中日法三种语言外,Deep Think在韩语、印地语、越南语、俄语、葡萄牙语等语种的区域竞赛中也取得优异成绩,多数达到或超越竞争对手水平。这种跨语言稳定性得益于Google团队专门设计的多语言训练框架,该框架覆盖东亚、欧洲和南美等科研重镇的主要语言,使非英语科学家首次获得与英语母语者同等的AI科研工具支持。

在科研应用层面,Deep Think已展现出超越竞赛的实用价值。基于该系统驱动的数学研究智能体Aletheia,能够自主生成、验证和修订研究级数学问题的解法,目前已参与完成多篇研究论文,其中一篇完全由AI自主完成的论文计算了算术几何中的特定结构常数。该系统还在计算机科学领域推翻了一个悬而未决十年的猜想,在物理学领域找到宇宙弦引力辐射的新型解析解,在经济学领域扩展了拍卖理论定理。

尽管成绩斐然,但Deep Think的评测方式仍存在争议。所有成绩均来自Google内部评测,未经过第三方独立复现或竞赛官方认证,具体评测方法、算力消耗和人工干预程度等关键细节均未公开。研究人员承认,当前测试均为各国区域选拔赛,题目难度与国际决赛存在显著差距,模型卡的正式更新也将进一步验证这些成绩的可靠性。

Google的这项突破正在重塑AI科研工具的竞争格局。当其他团队仍在英语基准测试中竞争时,DeepMind已将语言壁垒视为工程问题加以解决。如果这种多语言科研加速模式得到验证,全球非英语科研群体将首次获得与英语母语者平等的创新机会,这可能引发AI科研工具领域的全新竞赛。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version