ITBear旗下自媒体矩阵:

DeepSeek-V4预览版开源登场:百万上下文处理引领AI应用新突破

   时间:2026-04-24 13:32:31 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

深度求索公司近日正式发布其全新系列大模型DeepSeek-V4的预览版本,并同步向全球开发者开源。这一突破性成果标志着大模型技术正式进入百万级上下文处理的新阶段,为人工智能应用场景的拓展提供了更强大的技术支撑。

该系列模型采用创新的注意力机制架构,通过Token维度压缩与DSA稀疏注意力技术的结合,在保持百万字超长上下文处理能力的同时,显著降低了计算资源与显存消耗。模型体系包含两个版本:DeepSeek-V4-Pro配备1.6万亿参数,在智能体能力、世界知识掌握及复杂推理任务中达到国际开源领域领先水平;DeepSeek-V4-Flash则以更精简的参数量实现相近推理性能,为资源敏感型应用提供经济高效的解决方案。

在权威基准测试中,DeepSeek-V4-Pro展现卓越性能:在智能体编程评测中超越当前开源模型最优水平,使用体验优于Sonnet 4.5,交付质量接近Opus 4.6非思考模式;世界知识掌握能力较其他开源模型提升显著,数学、STEM及竞赛级代码生成等推理任务表现超越所有已公开评测的开源模型,达到国际顶级闭源模型水准。

技术生态方面,该公司同步更新API服务体系,新接口全面兼容OpenAI ChatCompletions与Anthropic协议标准。V4-Pro与V4-Flash均支持100万字符上下文长度,提供非思考模式与思考模式双选项。值得注意的是,现有API接口中的deepseek-chat与deepseek-reasoner模型将于2026年7月24日停止服务,开发者需及时迁移至新体系。

此次开源内容涵盖完整模型权重与技术文档,开发者可通过Hugging Face与ModelScope平台获取资源。这项技术突破不仅彰显中国在人工智能基础研究领域的创新实力,更为全球开发者社区提供了功能强大的工具集,有望加速AI技术在专业领域与复杂场景的落地应用。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version