在近期举办的AI创造者嘉年华上,硅星人创始人兼CEO骆轶航与月之暗面(Kimi)技术副总裁付强展开深度对话,围绕K2模型研发过程中的创新突破、技术路线选择及AGI(通用人工智能)发展路径展开探讨。这场对话揭示了Kimi在预训练架构选择、模型能力构建及开源生态建设等方面的独特思考。
针对K2模型采用与DeepSeekV3相似架构的争议,付强回应称技术决策需平衡创新与实用性。他以汽车工业类比指出:“架构相似性并非核心竞争力,关键在于能否通过优化实现性能突破。K2选择成熟架构的核心考量是兼容现有推理资源,同时通过超参数调整、专家模型数量扩展等技术创新,在保持架构相似性的前提下实现性能跃升。”技术报告显示,K2在注意力机制设计、基础模型紧致度等方面进行了深度优化,这些改进使模型在数据集和训练策略差异下仍能展现独特优势。
面对行业预训练投入缩减的趋势,Kimi选择逆势加大投入。付强坦言:“这需要企业忍受阶段性沉默,2024年Kimi减少市场曝光正是为了专注模型研发。”他反驳“Scaling Law失效”论调,指出高质量语料库的局限性才是制约因素:“单纯增加训练次数无法突破数据边界,关键在于提升单位数据的价值密度。”通过类比人类学习过程,付强解释了Kimi的技术路径:“如同优秀学生能通过一本书领悟更多知识,我们致力于提升模型对文本信息的深度解析能力,而非简单堆砌数据量。”
在开源战略选择上,Kimi展现出差异化定位。付强认为开源不仅是技术展示,更是构建进化闭环的关键:“开发者基于开源模型的应用创新,能为我们提供下一代模型研发的方向指引。这种‘领先半步’的策略,既保持技术开放性,又确保核心竞争力。”他特别强调开源对技术可信度的重要性:“闭源模型可能通过工程化手段掩盖真实能力,而开源生态的透明验证机制,更能推动模型向真正的AGI演进。”
针对Agent技术发展路径,付强用赛车手与赛车的比喻阐明观点:“第三方Agent如同专业车手,能通过API调用最大化发挥模型性能,但模型公司必须深度参与应用场景构建。”他指出当前Agent市场存在的认知误区:“某些方案试图通过人工规则实现智能调度,这本质上仍是工程化MoE(混合专家模型),而非模型原生能力。”Kimi的解决方案是在训练阶段就融入应用场景考量,通过端到端训练使模型具备原生工具调用能力,而非依赖后期微调。
在AI Coding领域,Kimi选择将编程能力作为AGI发展的重要标尺。付强解释这一选择的深层逻辑:“编程结果的客观可验证性,使其成为衡量模型智能程度的理想指标。相比需要主观判断的情绪价值输出,代码能否运行直接反映模型的真实能力。”这种技术导向也体现在K2的评估体系中,其编程能力获得OpenRouter等平台用户及顶级IDE厂商的认可,证明技术路线与市场需求的契合度。
对于AGI的发展方向,付强重申“苦涩的教训”理论:“历史经验表明,真正突破性的智能必须通过通用能力构建,而非特定场景优化。”他描绘了模型与人类协同进化的愿景:“理想的AI不应是被圈养的宠物,而应具备像人类祖先那样探索世界的能力——从钻木取火到科学实验,通过持续交互实现自我进化。”这种理念贯穿Kimi的技术研发,使其在追求模型智能密度的同时,始终保持对通用能力构建的关注。