滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

DeepSeek新模型Math-V2达奥数金牌水平，或推动数学AI系统新发展

时间：2025-11-28 13:40:20 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能领域，数学推理能力的突破一直是备受瞩目的焦点。近日，DeepSeek在Hugging Face平台悄然开源了一款名为DeepSeek-Math-V2的数学模型，这一动作迅速引发了行业内外的广泛关注。该模型不仅成为行业首个达到国际奥林匹克数学竞赛（IMO）金牌水平且开源的模型，更在数学推理能力上展现出了卓越的实力。

根据同步发布的技术论文，DeepSeek-Math-V2在多个基准测试中表现优异。在IMO-ProofBench基准测试中，该模型在Basic子集上的得分接近99%，远超其他同类模型。相比之下，谷歌旗下的Gemini DeepThink（IMO Gold）在该子集上的分数为89%，位列第二。不过，在难度更高的Advanced子集上，Math-V2的分数为61.9%，略低于Gemini DeepThink的65.7%。尽管如此，这一成绩依然证明了Math-V2在复杂数学推理任务中的强大能力。

论文指出，大语言模型在数学推理方面已经取得了显著进展，但当前的研究仍存在一定局限。许多模型以最终答案的正确性作为奖励机制，然而，正确的答案并不总能保证推理过程的严谨性。尤其是在定理证明等需要严格分步推导的数学任务中，最终答案奖励机制往往难以适用。为了突破这一瓶颈，DeepSeek团队提出，自我验证是扩展测试时间计算的关键，尤其是对于那些没有已知解决方案的开放问题。

基于这一理念，DeepSeek-Math-V2从结果导向转向了过程导向，专注于提升模型的定理证明能力。与依赖大量数学题答案数据的传统模型不同，Math-V2通过教会AI如何像数学家一样严谨地审查证明过程，实现了在没有人类干预的情况下持续提升解决高难度数学证明题的能力。这一创新方法不仅提高了模型的推理严谨性，也为其在数学领域的进一步应用奠定了基础。

论文还提到，Math-V2在IMO 2025和CMO 2024等国际数学竞赛中取得了金牌级成绩，并在Putnam 2024竞赛中通过扩展测试计算实现了接近满分的表现（118/120）。这些成绩充分证明了该模型在数学推理领域的领先地位。DeepSeek团队认为，尽管仍有许多挑战需要克服，但可自我验证的数学推理是一个可行的研究方向，有望推动更强大的数学AI系统的开发。

DeepSeek此次推出的Math-V2模型不仅在技术上取得了突破，也在行业内引发了热烈讨论。海外网友纷纷表示，DeepSeek的回归令人惊喜，其以显著优势击败谷歌的IMO Gold获奖模型DeepThink更是超出了预期。有网友猜测，DeepSeek可能还隐藏着更多惊喜，例如编程模型的发布。毕竟，在行业头部厂商纷纷迭代模型的背景下，DeepSeek的旗舰模型更新备受期待。

近期，AI领域竞争愈发激烈。11月，OpenAI发布了GPT-5.1，xAI紧随其后推出Grok 4.1，谷歌也发布了Gemini 3系列，引发了AI圈的广泛关注。在这样的背景下，DeepSeek的Math-V2模型无疑为行业注入了新的活力。尽管外界更关注其旗舰模型的更新动态，但Math-V2的推出已经证明了DeepSeek在数学推理领域的深厚实力和创新能力。

更多>同类资讯

雷军谈北京：创新实力与产业沃土，为小米汽车发展注入强劲动力

11-28

小米YU7小偏置碰撞设计揭秘：车体滑移+车轮旋转守护乘员舱安全

11-28

摩尔线程Torch-MUSA v2.7.0发布：功能性能双提升助力AI高效计算

11-28

从百度定律到人生破局：普通人如何用技术思维点亮前行之路

当你将三定律融会贯通，便能打造具有强大吸引力的个人IP：清晰的专业定位（相关性）、广泛的高质量连接（人气质量）和坚定的自我价值认知（自信心）。在这个充满不确定性的时代，愿你能以百度定律为舟，以人文温度为帆，…

11-28

多闪“逆袭”登顶社交榜，字节社交战略在AI时代迎来新突破？

在兜兜转转了一圈之后，字节才终于在社交持久战中为多闪找到了新坐标：放弃“再造一个微信”的野心，转而追求社交生态的内循环，防止抖音内产生的社交关系流失至外部平台。对于字节而言，相比从零开始冷启动一款新应用，…

11-28

小米汽车10月销量TOP20城市揭晓杭州夺冠郑州单店效率惊人

11-28

前特斯拉灵巧手专家卢泽宇加盟小米，小米机器人团队扩张加速技术落地

11-28

董明珠跨界带货遇挑战，家电直播赛道能否再造“董明珠式”顶流？

11-28

4800亿美元估值背后：字节跳动“延迟上市”的底气与业务支撑

11-28

Gemini3发布后谷歌市值飙升，皮查伊盼团队暂歇全力再启新程

11-28

网易云音乐“AI写歌”上线测试：普通高级双模式，一键开启音乐创作新体验

11-28

阿里财报释放新信号：闪购投入将收缩，AI需求旺盛前景可期

11-28

谷歌股价7个月翻番佩奇布林财富跃升跻身全球富豪榜前三

11-28

马斯克放话：Grok 5 2026 年将按规则挑战《英雄联盟》顶级人类战队

11-28

新加坡AI计划战略转向：弃Meta选阿里千问破解东南亚语言适配难题

11-28

点击查看更多 +

全站最新

上海叠纸科技公司增资至2.5亿增幅150%

中金资本董事长发生变更

元气森林等在咸宁成立食品科学研究公司注册资本1亿

揭秘永安水库被指偷工减料涉事公司

哈啰出行在沈阳成立网络科技公司注册资本3000万美元

湖州市股权投资公司登记成立注册资本30亿

热门内容

本栏最新

2026款吉利银河星舰7EM-i焕新登场五大维度进阶重塑电混SUV新标杆

埃安UT super 4.99万电池租用交付，配置足续航佳，换电普及度待考量

德系精工再升级！迈腾2026款携高速NOA与智能座舱焕新登场

京东携30余家顶尖品牌亮相2025智造大会加速智能机器人产业规模化发展

刘强东布局300万“狼族机器军团”，京东物流无人化与员工保障如何平衡？

华为乾崑与启境携手，以深度共创开启中国汽车未来新征程

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.