ITBear旗下自媒体矩阵:

DeepSeek V3.1重磅登场,编程实力超Claude 4,网友热盼R2与V4新版本

   时间:2025-08-20 12:02:13 来源:新智元编辑:快讯团队 IP:北京 发表评论无障碍通道
 

DeepSeek V3.1版本震撼发布,以其卓越的编程能力和超长的上下文处理能力,迅速吸引了业界的广泛关注。昨晚,DeepSeek官方低调上线了这一新版本,将上下文长度拓展至前所未有的128k,为用户带来了更加流畅和高效的交互体验。

据悉,此次开源的V3.1模型配备了高达685B的参数,并支持从BF16到FP8的多种精度格式,展现了其强大的技术实力。在编程方面,V3.1表现尤为突出,根据社区使用Aider的测试数据,它在开源模型中独占鳌头,取得了71.6%的高分,超越了Claude Opus 4,同时推理和响应速度也得到了显著提升。

除了编程能力的显著提升,V3.1还新增了原生「search token」的支持,进一步优化了搜索功能。线上模型去除了「R1」标识,引发了业界对于DeepSeek未来可能采用「混合架构」的猜测。在成本方面,V3.1也展现出了极大的优势,每次完整编程任务仅需1.01美元,成本仅为专有系统的六十分之一,这无疑为用户带来了更多的实惠。

值得注意的是,DeepSeek官方群中还强调了128K上下文的拓展,而此前V3版本已经具备了这一支持。这一更新迅速引发了网友们的热议,即便还未公布模型卡,DeepSeek V3.1就已经在Hugging Face的趋势榜上名列前茅,粉丝数也迅速突破了8万大关。

在实际测试中,DeepSeek V3.1的表现同样令人瞩目。在Aider Polyglot多语言编程测试中,V3.1一举击败了Claude 4 Opus和DeepSeek R1,拿下了71.6%的高分。同时,在SVGBench基准上,V3.1的实力也仅次于GPT-4.1-mini,远超DeepSeek R1。尽管在MMLU多任务语言理解方面,V3.1与GPT-5仍有一定的差距,但在编程、研究生级基准问答和软件工程等领域,V3.1已经展现出了强大的竞争力。

网友们对于DeepSeek V3.1的更新也充满了期待,纷纷表示希望尽快看到R2版本的发布。一位网友在实测中模拟了六边形中小球自由落体的物理测试,发现V3.1的理解力有了明显提升。这一测试也进一步验证了V3.1在上下文处理和推理能力方面的优势。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version