月之暗面Kimi近日宣布,面向特定用户群体正式推出Kimi K2.7 Code模型高速版。该版本在保持原有模型能力的基础上,输出效率实现显著提升,现已向Kimi Code Beta计划成员、Kimi API开发者及Kimi Business用户开放使用权限。
技术团队介绍,高速版与标准版采用相同模型架构,但通过底层优化将输出速度提升至普通版的5-6倍。在常规编程场景中(以输入长度中位数计算),输出速率可达180 Tokens/秒,处理短上下文任务时更可突破260 Tokens/秒。这一改进使得复杂代码生成、长上下文推理等场景的响应效率得到质的提升。
价格体系方面,高速版采用差异化定价策略。标准输入输出价格分别为每百万Tokens 13元和54元,缓存命中场景下的输入价格则降至2.6元/百万Tokens。值得注意的是,该定价是标准版Kimi K2.7 Code的两倍,反映出技术升级带来的成本增加。
回溯产品发展历程,Kimi K2.7 Code标准版于6月12日首次亮相。基准测试数据显示,相比前代K2.6模型,新版本在长上下文编程场景的指令遵循能力提升显著,长程任务处理性能获得突破性进展。特别值得关注的是,模型通过架构优化将过度思考现象减少30%,平均Token消耗量同步降低三成,有效提升了资源利用效率。









