近期,中国人工智能领域迎来重要进展,两家头部创业公司深度求索(DeepSeek)与月之暗面(Kimi)在一周内先后发布万亿参数级别的开源大模型。这并非两家企业首次“同频”行动——14个月前,它们曾于同日推出对标国际顶尖水平的推理模型。更引人关注的是,两家企业的创始人梁文锋与杨植麟均来自广东,且近期均以新质生产力代表身份受邀参加高层座谈会,这一系列巧合背后,折射出中国AI产业正在探索的独特发展路径。
在技术演进层面,两家企业展现出超越传统竞争的协作模式。Kimi采用的MLA注意力机制,其技术基础源于DeepSeek团队此前的公开研究成果,而DeepSeek V4中的核心优化器Muon,其有效性则由Kimi团队率先验证。这种技术互鉴在DeepSeek的技术报告中可见一斑——团队公开致谢Kimi的贡献,标志着中国AI领域正从“重复建设”转向“接力创新”。这种转变的深层逻辑在于,基础大模型研发需要海量资源投入,单纯的同质化竞争已难以持续,而通过共建关键基础设施与开源生态,能够更高效地推动整体技术进步。
算力约束成为催生创新的重要外部压力。在美国持续限制高端AI芯片出口的背景下,中国AI企业被迫在有限硬件条件下寻求突破。DeepSeek V4的突破具有标志性意义:该模型在保持性能的同时,将推理算力需求降至上一代的27%,且明确基于华为昇腾芯片训练。与此同时,Kimi也完成对国产芯片混合推理的支持布局。这些进展表明,通过算法优化、架构创新与软硬件协同,中国AI正在形成一条不同于美国“暴力计算”的技术路线,即在有限资源下挖掘硬件极限性能。
中国AI的技术影响力已开始向全球扩散。今年春季,英伟达GTC大会上,公司创始人黄仁勋在展示新一代硬件性能时,选择DeepSeek和Kimi作为基准模型,这一选择打破了欧美模型长期主导行业标准的格局。更值得关注的是,硅谷明星编程工具Cursor发布的“自研”模型被开发者发现底层调用了Kimi的API,连马斯克也证实了这一事实。类似情况也出现在日本——由官方资助、乐天集团发布的“自研”大模型,其关键参数被指出与DeepSeek V3高度相似。这些案例并非简单模仿,而是全球开发者基于实用主义的技术选择。
市场数据进一步印证了这种转变。据监测平台OpenRouter统计,今年一季度全球API调用量中,中国开源大模型的周词元调用占比已超过60%,Kimi和DeepSeek位居前列。这一数据表明,技术影响力的流动方向正在从硅谷单向辐射全球,转变为多极节点间的双向流动。中国AI企业的崛起,正在重塑全球技术生态的权力结构。
DeepSeek与Kimi的“双星现象”,是中国AI产业发展的一个缩影。在共同的国家战略引导下,面对相似的资源约束,两家企业通过开放协作与技术创新,自然形成了生态默契。这种发展模式表明,中国AI的突破不再依赖个别天才或单一企业的“孤军奋战”,而是依靠一个能够接力创新、共担风险、共享成果的坚韧生态。这种生态的成长,正在为全球AI发展提供新的可能性。







