月之暗面公司正式宣布开源其新一代多模态智能体模型K2.5,该模型在复杂任务处理、多智能体协同及视觉编程领域实现突破性进展。创始人杨植麟通过视频演示展示了模型核心能力,强调这是公司迄今为止功能最强大的技术成果。
在任务处理架构上,K2.5突破传统单智能体模式,可动态组建包含100个子智能体的集群系统。该集群能并行执行1500次工具调用,通过并行智能体强化学习技术实现自主协调,无需人工预设工作流。测试数据显示,在文档分析、深度搜索等复杂场景中,任务执行效率较前代提升最高达4.5倍,端到端运行时间缩短80%。
基准测试表现印证了技术优势:在HLE-Full综合推理、BrowseComp浏览交互等三项智能体评估中均获首位;编程能力方面,SWE-Bench多语言测试和验证集测试双料冠军;文档理解测试mniDocBench 1.5以88.8分领跑。特别在性价比维度,与GPT-5.2(xhigh)相比,K2.5在保持性能逼近的同时将使用成本降低显著。
视觉编程能力成为重要创新点。基于15万亿"视觉+文本"混合数据单元的预训练,模型具备图像视频转代码能力。用户上传录屏即可自动重建网页,通过简单对话就能生成包含专业动效的前端界面。在内部测试中,多语言环境下的代码构建、调试、重构等全流程任务完成度显著提升。
针对企业级应用场景,K2.5开发了四种运行模式:快速模式提供即时响应,思考模式擅长复杂问题拆解,Agent模式支持PPT/Excel等专业文档生成,集群模式则专攻大规模并行任务。实际案例显示,模型可同时处理100个细分领域的YouTube创作者分析,或基于单张照片生成全球婚礼旅行互动网页。
办公自动化领域实现重要突破。模型能解析万字论文级输入,直接生成包含数据透视表、LaTeX公式的专业文档。在内部生产力测试中,办公输出质量较前代提升59.3%,多步骤工作流表现提升24.3%。典型应用包括自动生成分镜脚本表格、提取加密PDF数据、构建财务模型等高密度任务。
同步推出的Kimi Code编程产品支持主流IDE集成,提供图像视频输入接口,可自动迁移现有技能至新环境。API定价策略显示,输入服务每百万token收费4元,输出服务21元,缓存输入低至0.7元。该模型已在Hugging Face和魔搭社区开放下载,提供完整的技术文档和开发工具包。
国际技术社区对K2.5给予高度评价。FireworksAI首席技术官指出其融合了开源领域最先进的推理、视觉和长上下文处理能力;AI工程师0xSero分享了使用模型创建网站的成功案例;KEA Research创始人则认为该技术展现出改变行业格局的潜力。这些反馈印证了模型在技术先进性和应用落地性方面的双重突破。











