近日,人工智能领域传来一则引人关注的消息:DeepSeek在筹备重大模型更新时,采取了与行业常规做法不同的策略。通常情况下,AI开发者会将主要模型的预发布版本分享给英伟达、AMD等芯片制造商,目的是确保软件能在广泛使用的硬件上高效运行。然而,DeepSeek此次却未遵循这一惯例,未向美国芯片制造商展示其即将推出的旗舰模型。
据了解,DeepSeek此次将V4模型的早期访问权限提供给了国内供应商,其中就包括华为技术有限公司。这一举动打破了行业长期以来的标准做法,此前DeepSeek曾与英伟达的技术人员有过密切合作,此次却未给予英伟达和AMD访问即将推出模型的权限,而是给予包括华为在内的中国厂商几周时间来适配其芯片。
对于这一情况,英伟达和AMD均拒绝发表评论,DeepSeek和华为也未对相关评论请求作出回应。尽管如此,这一事件还是引发了行业内外的广泛关注和讨论。
与此同时,消息源@legit_api于2月26日在X平台发布推文称,DeepSeek正在测试V4 Lite模型,该模型代号为“Sealion - lite”,拥有100万tokens的上下文窗口,并且原生支持多模态推理。本月早些时候,DeepSeek更新后开始灰度测试最高1M(百万)Token的上下文长度,其最新知识库已更新到2025年5月,即便在非联网状态下,也能准确输出2025年4月的新闻。











