滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

DeepSeek V4与Kimi K2.6同周亮相：中国AI开源模型开启“双雄”并进时代

时间：2026-04-24 19:37:46 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

中国人工智能领域迎来重大突破，DeepSeek与Kimi两大科技公司同周发布万亿参数级开源模型，引发全球开发者社区高度关注。DeepSeek V4以1.6万亿参数规模实现百万token上下文处理，其KV缓存需求较前代降低90%，在Codeforces编程竞赛中以3206分位列全球人类选手第23位，超越GPT-5.4同期表现。该模型同步开放权重下载、API接口及60页技术文档，开源首日即被开发者社区深度拆解分析。

就在DeepSeek发布三天前，Kimi宣布开源2.6万亿参数的K2.6混合专家模型（MoE），支持300个子智能体协同工作。该模型在OpenRouter平台创下单日2970亿token调用量纪录，成为全球最活跃的开源大模型。两个万亿级模型在同周亮相，技术路线却呈现互补特征：DeepSeek专注推理效率优化，K2.6则强化多智能体协作能力。

技术溯源显示，两家公司在关键技术领域存在深度交叉。K2.6采用的MLA多头潜在注意力机制，源自DeepSeek团队2025年提出的压缩存储方案，通过将Q/K/V向量压缩至低秩潜在空间，使KV缓存量减少80%。而DeepSeek V4使用的Muon优化器，则基于Kimi团队2025年初的Moonlight论文改进，通过牛顿-舒尔茨正交化处理梯度矩阵，在相同算力下实现两倍训练效率。

在长上下文处理领域，双方形成技术接力。Kimi2024年率先实现百万级上下文模型，但受限于成本难以推广。DeepSeek V4接棒推出CSA压缩稀疏注意力与HCA重压缩注意力组合方案，将推理算力需求降至前代27%，KV缓存压缩至十分之一，使长文本处理真正具备商业可行性。这种技术演进路径在KV缓存管理上同样体现，Kimi的Mooncake分离式存储与DeepSeek的异构缓存结构均指向同一工程瓶颈。

国际科技巨头已将中国开源模型纳入技术基准。英伟达2026年CES展演中，Rubin NVL72架构的训练基准采用DeepSeek模型，推理性能测试则选用K2-Thinking版本。meta在Muse Spark代码模型评测中，同时引入Llama 4、DeepSeek-V3.1及Kimi-K2作为对比基准，显示中国模型已成为全球AI研发的重要参照系。

商业应用层面，国际开发者已开始深度整合中国开源技术。估值500亿美元的AI编程工具Cursor，其Composer 2模型被证实基于Kimi K2.5架构开发，创始人承认该模型在代码困惑度测试中表现最优。日本乐天集团发布的Rakuten AI 3.0，底层架构同样采用DeepSeek技术方案。在OpenRouter平台最新排名中，K2.6与DeepSeek V3.2分列调用量榜首和第四位，中间仅隔Claude模型。

芯片适配领域呈现开放生态特征。DeepSeek V4技术报告证实，其细粒度专家并行方案同时支持英伟达GPU与华为昇腾NPU架构。Kimi团队在《Prefill-as-a-Service》论文中提出分离式推理架构，专门针对国产芯片进行混合部署优化。这种跨平台兼容性，使中国AI模型摆脱对单一硬件生态的依赖。

行业观察指出，两大模型的技术互鉴形成独特创新范式。DeepSeek在注意力机制中引入稀疏筛选策略，Kimi则探索线性注意力计算范式，虽路径不同但均指向降低Transformer架构的平方级复杂度。这种"和而不同"的竞争态势，推动中国AI技术在开源社区形成独特技术集群。

开发者社区的实时监测数据显示，K2.6与DeepSeek V4的GitHub星标数在发布72小时内均突破5万次，Hugging Face平台模型下载量合计超过200万次。国际开发者论坛涌现大量技术对比分析，有开发者指出："当某些闭源模型仍在互相设防时，中国团队已在论文中互相引用、在代码中彼此复用，这或许就是开源生态的真正威力。"

04-24

雷军官宣！小米YU7 GT 5月底登场，超千匹马力开启高性能驾驶新旅程

04-24

DeepSeek V4发布：开源新势力崛起，国产AI生态持续进化

04-24

2026北京车展启幕雷军亲临小米展台小米YU7 GT五月末将登场

04-24

小米YU7 GT强势登场！千匹马力+德系团队调校，高性能SUV市场要变天？

04-24

独家对话罗福莉：AI范式已然巨变！

04-24

中科大80后葛小川：从少年班到硅谷AI黑马CTO的逆袭之路

04-24

GPT-5.5发布：OpenAI加速迭代，AI顶流之争再掀波澜

04-24

百度APP双Agent引擎革新升级，搜索体验跃升，AI生态与创作者共繁荣

4月24日，百度在2026百度创作者大会上正式介绍全新升级的搜索AI引擎，搜索体验从“找到、知道”全面升级为“得到、做到”。并同步公布一系列核心数据：主动日活用户同比增长1.6倍；百家号创作者规模同比增长2…

04-24

京东产发深圳宝安智能产业园试运营废弃石场变身39万平现代化园区

观点网讯：4月24日消息，京东产发在深圳首个综合物流项目京东（宝安）智能产业园近日投入试运营，项目总投资约13.6亿元。信息显示，该项目位于宝安区松岗街道，总建筑面积约39万平方米，主体由两栋地上8层高标…

04-24

谷歌Vision Banana革新视觉AI：何恺明团队引领，开启「想象」征服现实新篇

04-24

谷歌TPU“分家”出击：TPU 8i精准卡位，在AI推理战场抢占先机

04-24

阿里云宣布：2026年4月30日起Qoder Teams版新购每席位月价升至300元

04-24

中国首款原生Robotaxi亮相，曹操出行如何以全要素闭环重塑出行未来？

04-24

2026北京车展启幕雷军携小米VisionGT概念车亮相破除外界偏见

专题：2026北京国际车展新浪科技讯4月24日上午消息，2026北京车展今日开幕，在小米汽车发布会上，小米集团董事长、CEO雷军发表演讲。此前在MWC2026上，小米VisionGT概念车首次全球亮相。雷军介…

04-24

点击查看更多 +

全站最新

龙虎榜丨恩捷股份涨停，深股通净买入6.02亿元，二机构净买入1.79亿元

美股异动丨诺基亚盘前续涨5% 昨日股价创约16年新高 Q1盈利超预期

股价暴涨875%！N联讯科创板上市，产品应用于光通信领域

美股异动丨美国舒适系统盘前涨超7%势创新高，Q1营收和净利大幅增长且远超预期

龙虎榜丨大普微涨5.64%，四机构净买入1.78亿元，玉兰路净卖出1.52亿元

极光旗下GPTBots.ai率先接入DeepSeek-V4 Preview：百万级上下文与新一代智能体AI赋能企业用户

热门内容

本栏最新

2026北京车展启幕小米Vision Gran Turismo超跑国内首秀展创新魅力

小米YU7 GT即将登场：千匹马力高性能SUV 5月发布续航达705公里

国产车崛起倒逼合资“低头”：新能源赛道下合资车价格“内卷”加剧

绿动未来智驾新篇——武商梦时代新能源巡展盛启共绘绿色出行蓝图

2026北京车展启幕小米Vision GT国内首秀雷军邀公众了解真实小米汽车

2026北京车展宝马展台亮点多全新iX3与i3长轴距版及新款7系/i7齐登场

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.