随着发布预期的临近,国产 AI 领军者 DeepSeek V4 的更多技术细节浮出水面。据知名爆料方 Legit 披露,DeepSeek 已开始对其代号为「sealion-lite(海狮轻量版)」的 V4 预览版本进行闭门内测,相关参与方均签署了严苛的保密协议。
相较于现有的 V3 模型,DeepSeek V4 将实现跨代际的跨越。新模型不仅原生具备多模态处理能力,更将上下文窗口直接拉升至 100 万 token。这意味着它能一次性“吞下”数本书籍或超长代码库,并进行深度逻辑推理。早期的测试反馈显示,V4 在生成复杂 SVG 矢量图形等高难度任务上效果惊艳,性能显著优于目前网页端及 App 端的在线模型。
AIbase 了解到,DeepSeek V4 预计将是一款万亿参数级别的巨型基础模型。正是由于模型规模的指数级增长导致训练周期拉长,其发布时间较原计划有所延后。值得关注的是,DeepSeek 在发布前打破了行业惯例,并未向英伟达、AMD 等美系芯片商提供预览,而是选择提前数周向包括华为在内的中国芯片供应商开放访问权限,以确保模型在国产算力平台上完成深度适配与优化。
与此同时,DeepSeek 的 GitHub 仓库近期也出现了密集更新。虽然多为工程师节后的例行代码整理,但也包含了大量与 API 集成相关的企业级解决方案。随着“下周发布”的传闻愈演愈烈,全球开发者都在屏息以待,看这家以“高性价比、高性能”著称的中国公司,将如何通过 DeepSeek V4 再次冲击全球 AI 竞争格局。
概要:











