据外媒The Information报道,有两位直接参与相关计划的知情人士透露,人工智能公司DeepSeek计划在2月中旬春节前后推出其新一代模型DeepSeek-V4,不过具体发布时间可能会根据实际情况有所调整。
DeepSeek-V4在编码能力方面表现突出,内部初步测试结果显示,该模型在编码领域的表现已超越Anthropic的Claude、OpenAI的GPT系列等现有其他模型。这一成果标志着DeepSeek在人工智能技术领域的又一次重大进步。
这两位知情人士还进一步介绍了V4模型的核心突破点。其一,在超长代码提示词的处理与解析上,V4模型实现了关键性的技术突破。这意味着它能够更高效、准确地理解和处理复杂的代码提示信息,为开发者提供更优质的辅助。其二,在整个训练流程的全阶段,V4模型的数据模式理解能力不仅没有出现性能衰减,反而相较于前代模型有了显著提升。
在人工智能模型的训练过程中,通常需要模型反复从海量数据集中学习知识。然而,在实际操作中,随着训练轮次的不断增加,模型对数据模式的捕捉能力往往会出现衰减现象。对于拥有大量AI芯片储备的开发者来说,解决这一问题的常规做法是通过增加训练轮次来弥补性能损耗。但DeepSeek-V4成功克服了这一难题,展现出其独特的技术优势。
对于用户而言,DeepSeek-V4的这些技术突破将带来实实在在的体验提升。在实际使用中,用户很可能会发现V4生成的答案逻辑更加清晰、结构更加规整。这充分表明该模型具备更强的深度推理能力,在处理复杂任务时的可靠性也将得到大幅提升,能够为用户提供更准确、更有价值的信息。
有网友注意到,在DeepSeek-V3.2的论文中提到,该公司使用了大模型竞技场平台(Chatbot Arena)进行人类偏好评估。基于这一信息,外界推测或许可以更早地在大模型竞技场上对DeepSeek-V4模型进行测试,提前感受其性能和特点。
更多详细信息可参考链接:https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability?rc=jn0pp4











