春节期间,备受关注的大模型领域迎来新动态。DeepSeek在未大张旗鼓宣传的情况下,悄然推出了新版本模型,引发全网热议。此前,众多网友都在期待DeepSeek发布大版本更新DeepSeek V4,但从目前情况看,春节期间发布大版本的可能性不大,此次悄然更新的版本已带来诸多亮点。
据DeepSeek官方介绍,此次更新重点提升了上下文处理能力,新版本上下文容量达到1M,而之前的DeepSeek V3系列仅为128K。这一显著提升,让DeepSeek具备了处理超长文本的能力。有网友通过实测证实,新版本可以一次性处理像《三体》三部曲这样体量的文本,这在以往版本中是难以实现的。
在回答自身身份问题时,DeepSeek新模型的表现也颇为特别。它明确表示自己就是最新的DeepSeek模型,没有特定的子名称,既不是V3也不是R1。这种表述方式,似乎在刻意强调与以往版本的不同,但又巧妙地避免了让人产生这是V4 Preview预览版的联想。
尽管DeepSeek官方未对其他方面能力提升作详细说明,但网友的反馈却十分积极。知名大模型测试博主@karminski - 牙医发布了一个快速测试,测试项目为编程领域的大象牙膏项目。测试结果显示,新模型在美学、建模、物理模拟以及代码性能等方面均有明显提升,甚至还带来了一些小惊喜,堪称当前DeepSeek版本中最优的大模型。
不过,新模型目前似乎还未达到完全稳定的状态。有网友针对当下热门的“50米距离上去洗车是走路还是开车去”这一问题进行测试,发现新模型给出的回答并不统一,有人得到正确答案,有人则未能得到理想结果,这也让新模型的实际能力引发了更多讨论。











