DeepSeek模型近日迎来重大更新,其线上版本已正式升级至DeepSeek V3.1。此次升级最显著的变化在于上下文窗口的扩展,从原先的64k增加至128k,用户现在可以通过网页、App以及小程序等多种渠道体验这一改进后的模型。
除了技术参数的升级,DeepSeek在用户界面上也做了细微调整。在App和网页端,原先的“深度思考(R1)”标识已被简化为“深度思考”。这一变化引发了部分网友的猜测,认为这可能是DeepSeek正在整合推理模型与非推理模型的信号。然而,截至目前,DeepSeek官方尚未对这一变动发表任何正式声明。
新版本模型已在Hugging Face平台公开,但目前仅开放了未经指令微调的Base版本。用户可以在该平台上下载模型的配置文件、脚本代码以及模型权重。与DeepSeek-V3-0324相比,新版本在模型参数量和张量类型上并未发生显著变化。
在对新版本进行初步体验后,不少用户发现DeepSeek V3.1在多个方面展现出了提升。例如,在编程领域,尤其是前端开发方面,新版本生成的代码不仅在长度上有所增加,而且在完成度和美观性上也取得了进步。一个设计美观、科技感十足的个人博客网站案例充分展示了这一点,与旧版本相比,新版网站的布局更加合理,栏目规划更为丰富,还配备了图片元素。
DeepSeek V3.1在小游戏开发方面也展现出了实力。在尝试复现Chrome浏览器断网时的小恐龙游戏时,新版本在两分钟内完成了开发。尽管在游戏外观和规则上与原版存在细微差异,但整体体验仍相当不错。然而,小恐龙的外观并未完全还原,且游戏障碍的生成和跳跃方式影响了可玩性。
在历史问题回答方面,DeepSeek V3.1同样表现出了改进。当用户提出关于非洲南部布须曼人是否喝牛奶的问题时,新版本不仅提供了更多细节,而且这些信息在事实核查后基本得到了印证。与旧版本相比,新版本在回答问题时语气更为活泼,语言更加通俗,同时更注重提供背景情境,使解释更加丰满。
在对比马斯克和OpenAI CEO Sam Altman谁更厉害的问题时,DeepSeek V3.1也展现出了其独特的回答风格。尽管用户要求只输出一个名字,但新版本还是为两位AI领域的佼佼者都送上了夸赞,展现了其平衡各方观点的能力。
在诗歌创作方面,DeepSeek V3.1同样不逊色。一首致敬DeepSeek V3的诗歌充满了各种比喻和类比,展现了其丰富的想象力。
值得注意的是,尽管DeepSeek V3.1在数学能力方面能够给出正确答案,但在解题过程中却经历了一些曲折。它先是给出了正确答案,但在最终回答时却给出了错误的数字,经过反思后才改回了正确答案。
DeepSeek V3.1的上线也吸引了众多网友的关注和体验。有AI博主表示,新版本打造的小球弹跳效果更加符合物理定律,还提供了重力、摩擦、旋转速度、弹跳等可调整的参数。还有网友利用新版本为自己打造了自画像,效果颇为有趣。