一场突如其来的服务中断,让DeepSeek再次成为舆论焦点。3月29日晚间至次日上午,大量用户反馈网页端与App频繁提示“服务器繁忙”,功能无法正常使用。这一事件迅速引发连锁反应,“DeepSeek崩了”的话题在百度、微博等平台冲上热搜前十,海外科技社区也展开热烈讨论,部分专业用户甚至通过实测对比服务中断前后的任务执行效果。
面对外界高度关注,DeepSeek官方始终保持沉默。3月30日上午,官网仅发布简短公告称“性能异常”,服务状态却显示为“正常”。这种“静默处理”模式与此前另一事件如出一辙——今年3月中上旬,OpenRouter平台出现一款名为Hunter Alpha的神秘模型,开发者普遍猜测其为DeepSeek V4的测试版本,但公司始终未作回应。后经证实,该模型实为小米MiMo-V2-Pro的内部测试版本。
这种“动静反差”的背后,是行业对DeepSeek V4的强烈期待。自2024年底V3发布、2025年初R1问世后,这家公司凭借极低算力成本登顶中美应用商店榜首,甚至引发美股半导体板块震荡。然而,原定今年一季度亮相的V4却多次推迟发布时间,从2月到春节前后,再到3月初,最新传闻称最早可能于4月发布。关于其定位、架构、性能乃至供应链的猜测层出不穷,其中一条供应链报道更引发技术圈震动。
据路透社报道,DeepSeek在重大模型更新前未向英伟达等美国芯片商展示旗舰模型,打破行业惯例。这一细节被解读为“绕过CUDA生态”的信号——英伟达万亿市值不仅依赖GPU硬件,更源于打磨十余年的CUDA软件生态,它为全球开发者提供了标准化路径。若DeepSeek真能构建替代方案,相当于在AI基础设施领域开辟新赛道。
开发者社区的“显微镜式观察”为这种猜测提供佐证。3月29日,X平台用户“AiBattle”发现DeepSeek模型标识发生变化:此前自称为V3的版本,在服务中断后改称“最新版本”,且零样本编码输出风格出现差异。通过SVG绘图测试(行业公认的大模型空间渲染能力“试金石”),该用户发现模型构图能力显著提升,但7小时宕机后质量又回落至原有水平。类似细节不断涌现:有用户测试发现模型知识截止日期可能延至2026年1月,另有证据表明2月11日上下文窗口已从128K扩展至1M tokens。
这种技术路线差异可能重塑行业格局。2025年GTC大会上,英伟达CEO黄仁勋将“买得越多,省得越多”升级为“买得越多,赚得越多”,强化算力投资的合理性。但若DeepSeek的技术组合实现商业化突破,意味着存在替代路径:通过算法与工程创新降低对高端芯片的依赖。路透社2月25日的报道称,DeepSeek已将旗舰模型提前适配华为等中国芯片商,却未向英伟达或AMD开放预览,这一反常举动加剧了外界对“算力溢价转移”的猜测。
目前,V4的发布时间仍是未知数。但可以确定的是,DeepSeek正通过论文、开源项目与社区测试释放技术信号,其核心策略清晰可见:以算法效率弥补硬件短板,用开源生态构建商业模式,最终用效率革命挑战算力霸权。当行业还在争论“何时发布”时,真正的悬念或许是:这场静默进行的技术革命,将在多大程度上改写AI产业的权力版图。











