月之暗面公司近日宣布开源其最新人工智能模型K2.5,这一消息在AI领域引发广泛关注。该模型在复杂任务处理能力上实现重大突破,能够自主协调多达100个子智能体组成的集群,并行执行最高1500次工具调用。这种创新架构使任务执行效率较单智能体模式提升最高达4.5倍,且整个集群的创建与协调完全由模型自动完成,无需人工预设工作流程。
在基准测试中,K2.5展现出卓越性能。在综合推理、浏览交互和深度搜索问答三个Agent基准测试中均取得领先成绩;编码能力方面,在多语言编程测试中位居榜首;文档理解测试中以88.8分刷新纪录。特别值得注意的是,该模型在保持与GPT-5.2相近性能的同时,成本显著降低,这种性价比优势使其在商业应用中更具竞争力。外网技术专家评价称,K2.5集成了开源领域最先进的推理、视觉处理和长上下文处理能力。
针对软件开发场景,月之暗面同步推出编程产品Kimi Code。这款可直接在终端运行的产品支持与主流开发工具集成,具备图像视频输入处理能力,并能自动识别现有技能进行迁移。其API定价策略颇具吸引力:输入每百万Token收费4元,缓存输入0.7元,输出每百万Token收费21元。这种定价模式为开发者提供了经济高效的选择。
K2.5提供四种操作模式:快速模式适用于需要即时响应的场景;思考模式专门处理复杂问题;Agent模式擅长生成各类办公文档;集群模式则针对需要并行处理的复杂任务。在视觉编程领域,该模型展现出独特优势,能够将简单对话转化为具有专业设计水准的前端界面,甚至通过上传录屏视频就能重建完整网页。这种能力源于其大规模视觉-文本联合预训练,使视觉与文本处理能力同步提升。
在办公自动化方面,K2.5取得显著进展。该模型能够处理高密度、大规模的办公任务,包括解析复杂文档、协调多步骤工具使用,并直接生成专业级输出成果。内部测试显示,其办公输出质量较前代模型提升近60%,在财务模型构建、学术论文综述等高级任务中表现突出。例如,该模型曾成功将40篇社会心理学论文综述任务分解,最终生成包含完整引用的100页学术文档。
实际应用案例充分展示了K2.5的强大能力。在处理大规模并行任务时,模型集群可同时研究100个细分领域并找出顶尖YouTube创作者;仅凭一张结婚照就能生成符合文化背景的全球婚礼旅行方案;在文献处理方面,能将200多篇文章按主题分类并生成结构化摘要。这些案例证明,K2.5已具备处理企业级复杂工作流程的实力,为知识工作自动化提供了新的解决方案。









