ITBear旗下自媒体矩阵:

月之暗面核心团队Reddit答疑:澄清成本谣言,畅谈模型创新与未来规划

   时间:2025-11-11 15:22:07 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,月之暗面核心团队在海外社交平台Reddit上发起了一场深度互动问答活动,联合创始人兼CEO杨植麟等多位技术负责人就模型研发、技术路线选择及开源生态建设等热点问题展开回应。此次活动吸引了大量海外开发者参与,问题覆盖模型性能优化、技术架构创新及商业化路径等多个维度。

针对Kimi K2 Thinking模型训练成本的网络争议,杨植麟明确否认"460万美元"的传言。他指出,模型研发成本难以简单量化,研究实验阶段的投入占比显著。同时透露团队已启动视觉-语言(VL)版本研发,但纯文本模型优先发布是因正确数据获取与训练需要更长时间。对于用户反馈的推理时间过长问题,他解释当前版本优先保障绝对性能,后续将通过奖励机制优化token使用效率。

在技术架构层面,混合线性注意力架构Kimi Linear成为讨论焦点。该架构在短上下文、长上下文及强化学习扩展等场景首次超越传统全注意力机制,其核心模块KDA已被纳入下一代模型规划。杨植麟透露,KDA在长思维链强化学习场景中展现出高效优势,未来可能结合扩散模型进行创新,但文本扩散应用仍面临先验不足的技术挑战。算法负责人周昕宇进一步说明,KDA混合架构在预训练和强化学习阶段均优于传统方案,成本效益显著提升。

面对模型实际体验与榜单成绩的差异质疑,杨植麟承认现阶段存在通用能力不足的问题。他以HLE基准测试为例,表示团队正在通过提升智能体推理能力来改善实际应用表现。对于用户提出的100万token上下文窗口需求,周昕宇坦言此前尝试因服务成本过高暂停,但未来会重新评估技术方案。在模型部署方面,针对企业用户对"中国大模型"的安全顾虑,联合创始人吴育昕强调开源策略可消除部分担忧,企业自主部署能提升信任度。

关于AI浏览器开发计划,周昕宇直言无需通过Chromium套壳实现模型优化,团队将专注核心模型训练并持续更新kimi.com功能。在商业化层面,针对编程订阅方案API计费模式引发的资源消耗争议,团队表示将探索更优解决方案,同时强调当前计费方式符合企业成本结构且透明度高。对于小型模型需求,杨植麟透露已发布Kimi-Linear-48B等轻量化版本,未来将扩展更多功能模型。

这场持续数小时的技术对话,不仅展现了月之暗面在混合注意力架构、强化学习等领域的创新突破,更通过坦诚回应海外开发者关切,彰显了中国AI团队的技术自信与开放态度。从模型性能优化到开源生态建设,从技术路线选择到商业化实践,这场跨越时区的问答揭示了中国AI创新正在获得全球技术社区的深度关注。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version