AIPress(AI 普瑞斯)
刚刚,专注于人工智能基准测试的非营利组织Epoch AI发布最新分析报告。
揭露了一个让人意想不到的事:
开源模型与闭源模型的性能差距不是在缩小,而是在扩大。
从3个月拉到4个月
Epoch AI指出,他们再次审视了开源模型与闭源模型之间的能力差距。自年初以来,开源模型一直落后于前沿闭源模型4个月。
值得注意的是,与Epoch上次的分析相比,这一差距略有扩大。此前,Epoch估计2023年1月至2025年10月期间,二者的平均差距为3个月。
这张图表的横轴是模型的发布日期,纵轴是Epoch用来衡量模型差距的能力指数(不是月份数)。
Epoch能力指数是对模型能力的综合衡量指标。
Epoch指出,自2026年1月以来,开源与闭源之间的平均差距为8个ECI点,大概类似于GPT-5与GPT-5.5之间的差距。
从图表也能看出,在2024年第三季度时,双方能力曾一度十分接近,不过并不稳定。
另外一个值得注意的点,2025年春节发布的Deepseek-R1曾让差距缩小,但此后逐渐又有了扩大的趋势,虽然不是特别明显。
DeepSeek也承认了
事实上,在2025年12月份,DeepSeek 发布了V3.2技术报告,就曾经明确指出开源与闭源模型的性能差距在扩大。
当时DeepSeek认为开源模型在复杂任务上能力的三个关键缺陷。
一方面,在架构层面,对标准注意力机制的过度依赖严重制约了长序列处理的效率;
其次,在资源分配方面,开源模型在后训练阶段的计算投入不足,限制了模型在高难度任务上的表现;
最后,在AI智能体领域,开源模型在泛化能力和指令遵循能力上与专业模型相比存在明显差距,影响实际部署效果。
我们也能明显感受到,以GPT和Claude为代表的闭源大模型在智能体的领先优势。
谁是下一个DeepSeek?
Epoch AI的这张图说了一个更冷酷的事实:当闭源厂商在算力、数据工程、后训练优化上持续加码,开源模型靠社区热情和有限资源想追平,难度只会越来越大。
当然,这不意味着开源没有价值。恰恰相反,开源模型的生态价值、可定制性、透明度,是闭源永远替代不了的。











