滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

DeepSeek V4基准测试泄露？消息疑似为假

时间：2026-02-16 17:01:39 来源：格隆汇编辑：快讯 IP：北京 发表评论无障碍通道

格隆汇2月16日｜据新智元，一张图在全网疯狂刷屏了！据说，DeepSeek V4的基准测试已经泄露，整个AI圈都震了。有大V总结道：AI编程大战，已经达到了新的高峰。泄露信息显示，DeepSeek V4在SWE-bench Verified上取得了惊人的83.7%，超过了Claude Opus 4.5（80.9%）和GPT-5.2（80%）。可以说，100万+上下文长度+Engram记忆机制=真正的全仓库级推理能力。

还有网友综合了全网DeepSeek V4消息，不仅在Humaneval、SWE_bench、上下文和成本上刷新成绩，而且发布时间预计在春节，也就是明天！成本：据称比OpenAI便宜20到40倍，预计发布时间：2月17日。如果是真的，DeepSeek将又一次改变游戏规则。总之，DeepSeek V4的发布时间，很可能是周一。据说，这是首个不落后于闭源顶尖模型，甚至能与之匹敌甚至超越的模型。

不过，这几张流传出来的基准测试，很快被怀疑是假的。比如在官方评分系统下，不可能有模型达到99.4%的分数。最高分只能是99.2%或 100%。另Epoch AI也确认，FrontierMath的数据是伪造的，因为只有他们和OpenAI有权对该数据集进行评估。至少有两个基准测试被打假，证明这些图可信度确实不高。有趣的是，即便是假的，这也说明DeepSeek的确深得人心，网上的夸大其词的泄露就是DeepSeek成功最大的标志。

更多>同类资讯

OpenClaw“龙虾”智能体走红：享受便利时，安全规范使用不可忘

据“国家安全部”微信公众号消息，OpenClaw（昵称“龙虾”）是一款开源AI智能体工具，上线不久便迅速成长为2026年度现象级“开源奇迹”。不少用户从付费安装“龙虾”，到付费卸载“龙虾”，养“龙虾”正在成为…

03-18

长征八号系列火箭2026年4月初将择机发射长八甲助力卫星部署升级

03-18

长征八号系列火箭2026年4月初择机发射长八甲助力卫星互联网建设升级

03-18

荣耀新游戏本发布在即：猎人LOGO回归，或归属WIN系列下月上市

03-18

嫦娥六号立大功！国际首台负离子分析仪实现月球负离子直接探测

03-18

我国科研团队发现单电荷双粲重子助力探索物质深层次结构

03-18

高盛称股市未出现投降式抛售认为宜简化组合增持现金

03-18

英伟达CEO黄仁勋：对1万亿美元+的收入预期具有强烈的“能见度”

03-18

伊朗持续抓间谍还查获数百套星链

03-18

特朗普称应考虑美国退出北约的可能性

03-18

德银天下(02418.HK)拟3月27日举行董事会会议审批全年业绩

03-18

佳讯飞鸿(300213.SZ)：5G-R相关试验工作正在按计划有序推进中

03-18

嘉士利集团(01285.HK)拟3月31日举行董事会会议审批全年业绩

03-18

龙蟠科技(02465.HK)拟使用不超过4亿元闲置募集资金进行现金管理

03-18

万国数据-SW(09698.HK)2025年度净利润9.59亿元同比扭亏为盈

03-18

点击查看更多 +

全站最新

奥迪全球CEO高德诺辟谣南北奥迪合并：双伙伴战略持续，在华布局明晰

小米汽车感恩回馈：为SU7、YU7、Ultra首任车主送定制冰箱贴及纪念勋章

平安银行“小橙帽”出击！3·15为“城市奔跑者”筑牢金融消保防线

百度搜索Skill成OpenClaw“装虾”利器下载量全球夺冠助力AI发展

章鱼动力获数亿元种子轮融资顶尖团队与资本入局具身智能赛道潜力足

飞速创新(03355.HK)招股中，AI革命浪潮"卖铲人"填补港股赛道空缺

热门内容

本栏最新

飞速创新(03355.HK)招股中，AI革命浪潮"卖铲人"填补港股赛道空缺

阿里发布"悟空"，要把"龙虾"装进2000万企业组织里

直击GTC现场："J. Huang WAS HERE"! 联想集团新一代工作站亮相

潍柴动力(02338.HK)获摩根大通增持92.58万股

飞速创新(03355.HK)招股中，AI革命浪潮"卖铲人"填补港股赛道空缺

阿里发布"悟空"，要把"龙虾"装进2000万企业组织里

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.