在近期举办的一场重要技术活动上,LM Studio与苹果公司联手完成了一项引人注目的技术突破:利用四台消费级Mac Studio设备搭建的集群,成功运行了月之暗面公司开发的万亿参数大模型Kimi K2.6。这一成果颠覆了行业对"大规模AI模型必须依赖云端高性能计算集群"的传统认知,标志着消费级硬件已具备承载前沿AI推理任务的能力。
Kimi K2.6作为当前参数规模最大的开源模型之一,其总参数量达到1万亿级别,采用混合专家(MoE)架构设计,实际激活参数为320亿。该模型不仅支持超长上下文处理,还能实现多模态输入理解和智能体任务执行。在本次演示中,四台Mac Studio通过苹果创新的内存共享技术形成计算集群,总可用内存容量突破1.5TB,完全满足模型推理的内存需求。开发者测试数据显示,在相同硬件配置下,该方案可实现每秒28个token的生成速度,同时能耗表现显著优于传统GPU集群方案。
技术演示的另一大亮点是LM Studio推出的LM Link远程访问功能。通过该技术,用户可使用MacBook Neo笔记本或iPhone等移动设备,安全地连接到本地Mac Studio集群进行实时交互。整个数据传输过程完全在本地网络环境完成,不经过任何云端服务器,配合端到端加密技术,有效保障了用户数据隐私。这项功能已集成至LM Studio的Mac客户端和Locally AI的iOS应用中。
苹果公司提供的Thunderbolt 5 RDMA技术为多设备内存共享提供了关键支持。该技术允许不同设备间的内存资源实现高效池化,构建出具备集群级算力的本地计算环境。这种架构设计既保持了消费级设备的便携性优势,又突破了单台设备算力限制,为AI应用的本地化部署开辟了新路径。
此次技术合作向业界传递了明确信号:随着硬件互联技术的持续进步,在消费级设备上部署和运行万亿参数规模的大模型正从理论走向实践。这种技术演进不仅降低了AI应用的准入门槛,更为注重数据隐私和安全性的场景提供了可行的解决方案。当前,双方正在持续优化多设备协同效率,探索更多消费级硬件组合的可能性。











