滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek V4基准测试引热议，编程能力或超顶尖闭源模型，明日发布？

时间：2026-02-17 08:29:08 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

近日，一款名为DeepSeek V4的开源大模型引发AI圈热议。有消息称，该模型或将于春节期间正式发布，其编程能力、上下文处理能力等多项指标均达到行业顶尖水平，甚至被部分网友称为“首个能匹敌顶尖闭源模型的开源模型”。

据泄露的基准测试数据，DeepSeek V4在SWE-bench Verified测试中取得了83.7%的成绩，超越了Claude Opus 4.5（80.9%）和GPT-5.2（80%）。这一成绩若被证实，将直接改写当前“最强代码模型”的排名。该模型在AIME 2026、IMO Answer Bench等数学推理测试中也表现出色，分别取得99.4%和88.4%的高分，甚至在FrontierMath Tier 4测试中达到GPT-5.2的11倍成绩。

除了编程和数学能力，DeepSeek V4的上下文处理能力同样引人注目。有传闻称，该模型支持高达100万token的上下文长度，并引入了新的Engram条件存储系统，能够实现近乎无限的上下文检索。这一特性使其在处理大型代码库或复杂分布式系统时更具优势，能够理解代码库中文件变化对其他部分的影响，为企业级开发提供强大支持。

然而，随着消息的传播，部分基准测试数据的真实性也受到质疑。有业内人士指出，在官方评分系统下，模型不可能达到99.4%的分数，最高分应为100%或99.2%。Epoch AI也确认，FrontierMath的数据存在伪造嫌疑，因为只有他们和OpenAI有权对该数据集进行评估。这些质疑使得DeepSeek V4的真实性能蒙上一层阴影。

尽管如此，DeepSeek V4的发布仍被视为开源模型领域的一次重要突破。此前，DeepSeek的V3和R1模型已证明开源AI模型能够以极低成本与专有模型竞争，而V4则有望在此基础上进一步提升开源模型的竞争力。据透露，V4在训练过程中对数据模式的理解能力得到提升，且不易出现性能衰减，输出结果在逻辑上也更加严密和可靠。

目前，DeepSeek官方尚未对V4的发布时间和具体性能作出正式回应，但业内普遍猜测，该模型可能正在测试一个轻量级版本（V4-lite），以逐步释放其技术潜力。与此同时，Hugging Face、GitHub等平台上仍未出现DeepSeek V4的相关更新，进一步加剧了外界对其真实性的猜测。

无论DeepSeek V4的最终性能如何，其引发的讨论已充分说明开源模型在AI领域的影响力正在不断扩大。随着技术的不断进步，开源与闭源模型之间的竞争或将更加激烈，而用户也将从中获得更多选择和更高质量的AI服务。

更多>同类资讯

北京车展见证汽车业新变局：电动化智能化加速中国品牌引领风向

04-15

从虚拟到现实：让双足机器人走稳每一步，背后是无数次的调试与坚持

04-15

英伟达“伊辛”模型开源登场量子计算板块受提振集体走高

04-15

英伟达发布全球首个开源量子AI模型Ising 助力量子计算实用化进程提速

04-15

13家上市银行豪掷1800亿加码金融科技大模型应用开启规模化落地新篇

证券时报记者梳理多家上市银行年报发现，在金融服务实体经济质效持续提升的背景下，国有大行与股份制银行正以差异化路径推进数字化转型，金融科技投入保持稳健增长，人工智能大模型应用进入规模化落地阶段。具体来看，…

04-15

奕行智能TISA架构入选ISCA 2026，AI芯片动态调度开启能效比新篇章

在此背景下，近期智东西与奕行智能进行了深入交流，了解到其最新突破性研究正直指这一AI芯片行业痛点，其内部已研发实现基于Tile级虚拟指令集实现AI加速器的动态调度（TISA）。从产品技术布局上来看，在芯片…

04-15

OpenAI扩大TAC计划推GPT-5.4-Cyber赋能网络安全防御新升级

04-15

Claude Code新功能上线：云端例程助Mac离线执行，Mac客户端同步焕新升级

04-15

吉利i-HEV智擎混动技术发布：以五大颠覆引领全球油混进入智能新时代

04-15

16家科技社团联合发布《全球人工智能治理科技社团倡议》共促智能向善

04-15

郑州超算核心节点启用：6万张AI加速芯片构建科学智能计算新引擎

今年2月5日，国家超算互联网核心节点率先上线试运行，初期开放由超3万张国产AI加速芯片组成的超级计算集群，提供大规模AI算力； 4月14日，AI加速芯片升级到6万张，推动超算互联网构建起国内最大规模的科学智能…

04-15

冯佳林：二十载坚守航天一线以极致匠心铸就探月“稳腿”传奇

作为一名数控车工特级技师，同时也是国家级技能大师工作室——“王连友技能大师工作室”专家成员，我先后参与了神舟飞船、空间站舱体、嫦娥系列探测器等多项国家重大航天工程，始终在机床前守护着大国重器的每一丝精度。从…

04-15

英伟达发布Ising模型：为量子计算校准纠错提供开源AI新方案

04-15

郑州超算互联网核心节点启用最大规模科学智能计算集群助力AI科研新飞跃

今年2月5日，国家超算互联网核心节点率先上线试运行，初期开放由超3万张国产AI加速芯片组成的超级计算集群，提供大规模AI算力；4月14日，AI加速芯片升级到6万张，推动超算互联网构建起国内最大规模的科学智能计…

04-15

中科曙光6万卡AI4S计算集群郑州启用助力“人工智能+科研”深度融合

作为国内最大的AI4S计算集群，其以超智融合全栈技术能力，满足用户从集群性能、软件模型优化、科研应用效率到科学智能体开发的多维需求，为“人工智能+科学技术”在国内的规模化落地提供保障。中科曙光高级副总裁李斌…

04-15

点击查看更多 +

全站最新

WTI原油期货跌至87美元下方

消博会重磅来袭！科大讯飞40克AI眼镜，解锁跨语言沟通新境界

凯迪拉克凯威德：2+2+2六座布局，智能座舱与豪华配置打造精致出行新体验

单踏板模式：重塑纯电驾驶体验，让续航与操控在电流中完美共舞

钠离子电池迎突破！中科院团队攻克热失控难题，新能源车安全再升级

插电混动汽车：加油与充电的便利性博弈，哪种方式更适合你？

热门内容

本栏最新

吉利i-HEV智擎混动技术发布：以五大颠覆引领全球油混进入智能新时代

郑州超算核心节点启用：6万张AI加速芯片构建科学智能计算新引擎

以AI为刃破局混动江湖吉利i-HEV智擎混动技术开启智能节能新纪元

吉利i-HEV智擎混动发布：AI赋能节能降耗，安全耐用引领油混新标准

吉利i-HEV智擎混动技术“五大颠覆”来袭引领中国混动迈向全球新高度

郑州超算核心节点启用！最大规模科学智能计算集群助力AI科研新飞跃

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.