ITBear旗下自媒体矩阵:

月之暗面Kimi K2.5开源登场:多模态升级,智能体集群效率飙升4.5倍

   时间:2026-01-28 10:21:53 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

月之暗面公司正式宣布开源其新一代多模态智能体模型K2.5,该模型在复杂任务处理、多智能体协同及视觉编程领域实现突破性进展。创始人杨植麟通过视频演示展示了模型核心能力,强调这是公司迄今为止功能最强大的技术成果。

在任务处理架构上,K2.5突破传统单智能体模式,可动态组建包含100个子智能体的集群系统。该集群能并行执行1500次工具调用,通过并行智能体强化学习技术实现自主协调,无需人工预设工作流。测试数据显示,在文档分析、深度搜索等复杂场景中,任务执行效率较前代提升最高达4.5倍,端到端运行时间缩短80%。

基准测试表现印证了技术优势:在HLE-Full综合推理、BrowseComp浏览交互等三项智能体评估中均获首位;编程能力方面,SWE-Bench多语言测试和验证集测试双料冠军;文档理解测试mniDocBench 1.5以88.8分领跑。特别在性价比维度,与GPT-5.2(xhigh)相比,K2.5在保持性能逼近的同时将使用成本降低显著。

视觉编程能力成为重要创新点。基于15万亿"视觉+文本"混合数据单元的预训练,模型具备图像视频转代码能力。用户上传录屏即可自动重建网页,通过简单对话就能生成包含专业动效的前端界面。在内部测试中,多语言环境下的代码构建、调试、重构等全流程任务完成度显著提升。

针对企业级应用场景,K2.5开发了四种运行模式:快速模式提供即时响应,思考模式擅长复杂问题拆解,Agent模式支持PPT/Excel等专业文档生成,集群模式则专攻大规模并行任务。实际案例显示,模型可同时处理100个细分领域的YouTube创作者分析,或基于单张照片生成全球婚礼旅行互动网页。

办公自动化领域实现重要突破。模型能解析万字论文级输入,直接生成包含数据透视表、LaTeX公式的专业文档。在内部生产力测试中,办公输出质量较前代提升59.3%,多步骤工作流表现提升24.3%。典型应用包括自动生成分镜脚本表格、提取加密PDF数据、构建财务模型等高密度任务。

同步推出的Kimi Code编程产品支持主流IDE集成,提供图像视频输入接口,可自动迁移现有技能至新环境。API定价策略显示,输入服务每百万token收费4元,输出服务21元,缓存输入低至0.7元。该模型已在Hugging Face和魔搭社区开放下载,提供完整的技术文档和开发工具包。

国际技术社区对K2.5给予高度评价。FireworksAI首席技术官指出其融合了开源领域最先进的推理、视觉和长上下文处理能力;AI工程师0xSero分享了使用模型创建网站的成功案例;KEA Research创始人则认为该技术展现出改变行业格局的潜力。这些反馈印证了模型在技术先进性和应用落地性方面的双重突破。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version