在近期清华大学举办的一场公开活动中,月之暗面(Kimi)总裁张予彤分享了公司最新技术突破与商业战略,这是她自卷入与金沙江创投主管合伙人朱啸虎的争议后首次公开露面。去年底,朱啸虎曾公开指责张予彤在职期间隐瞒持有月之暗面900万股免费股份,称其违反受托责任。对此,月之暗面创始人杨植麟随后发文回应,确认张予彤作为联合创始人的身份,强调股份授予是基于其在公司运营、战略及融资方面的长期贡献,且与部分股东未投资月之暗面的决策相互独立。
尽管面临外界质疑,张予彤仍以公司战略与商业化负责人的身份推进业务发展。她指出,AI行业过去普遍认为“没有百万张显卡就无法训练大模型”,但月之暗面的实践正在打破这一“资金算力决定论”。在训练万亿参数的Kimi K2模型时,团队首次验证了二阶优化器Muon的大规模应用可行性,使token效率提升至少两倍。这一突破不仅降低了训练成本,更实现了“用同一份数据提取更多智能价值”的目标。张予彤强调,当前训练大模型的核心瓶颈已从算力转向数据,而Muon优化器的落地攻克了规模化训练中的稳定性难题。
技术路线创新之外,月之暗面还推行“Day-0 Co-Design”理念,即在模型训练前深度耦合基础设施与算法设计。张予彤解释,这种跨团队协作模式使每一项优化都能以“复利”形式提升智能效率。市场反馈印证了这一策略的有效性:今年11月上线的Kimi K2 Thinking模型在多项国际基准测试中表现优异,包括“人类最后的考试”(Humanity's Last Exam)等,在斯坦福大学HELM综合评测中获非思考模型最佳成绩,第三方平台LMArena显示其为开源模型中表现最优者。目前,Cursor、Youware、Genspark及Perplexity等全球知名AI应用已接入该模型,其中Perplexity在模型列表中除四个闭源模型外,仅选择了Kimi K2 Thinking。
在应用场景拓展方面,张予彤透露,AI搜索中的深度研究是Kimi模型的核心优势。K2 Thinking支持多达300轮工具调用,可边思考边完成复杂调研任务。例如,Vercel创始人在内部测试中发现,Kimi在实际Agent场景中的表现优于其他闭源模型;投资机构Social Capital的CEO也表示,旗下公司已将大量工作迁移至K2平台,因其“性能强且成本显著低于顶尖闭源模型”。从产品层面看,月之暗面今年践行“模型即产品”理念,将模型与Agent体验垂直整合。推出的“OK Computer”Agent模式支持图片生成、音频生成等20余种工具,工具调用步数近期将从50步升级至300步,目标成为“每个人的全栈助理”。用户测试显示,该模式能处理庞大Excel文件或大量文件上下文理解等“长时任务”,未来将重点优化Agent的持续工作能力。
面对大模型市场的激烈竞争,张予彤提出“不竞争的竞争策略”。她认为,创业公司应聚焦自身叙事与优势领域,而非直接对抗巨头。月之暗面的核心竞争力体现在两方面:一是底层技术创新,解决大模型领域尚未攻克的本质问题;二是端到端联合优化能力,凭借300人的精简团队实现算法、工程、产品的快速迭代。在产品定位上,公司主动舍弃生活娱乐和多模态生成方向,专注于逻辑层、Agent层及生产力任务,如深入研究、PPT制作、数据分析等。张予彤强调,这些任务需要长程规划与复杂工具调用,能创造更高经济价值。
谈及模型公司与AI应用的关系,张予彤指出,与互联网产品不同,大模型能力仍处于快速演进阶段,应用侧需具备“前瞻性设计”能力。她解释,若产品设计滞后于模型能力跃升,可能导致体验革新受限;反之,若过度超前设计,则可能因模型能力不足而无法落地。因此,应用开发需紧密跟踪技术路径,预判未来能力边界,以实现产品与模型的同步升级。












