美国AI模型开发商Zyphra近日宣布完成新一轮融资,美国芯片巨头AMD参与其中,此次融资规模达5亿美元,公司估值预计将突破50亿美元。这家成立于2020年的企业专注于开发开源AI模型,并提供配套的云基础设施服务,其技术路线与主流AI实验室形成鲜明对比——所有模型训练和推理均基于AMD硬件平台运行。
在硬件选择上,Zyphra完全摒弃了英伟达芯片,转而采用AMD全栈解决方案。其核心产品Zyphra Cloud云平台最初以AMD MI355X GPU为基础,支持开源模型的无服务器推理服务。随着技术迭代,该平台已扩展至裸机AMD基础设施,提供两种灵活部署模式:按需配置的裸机GPU集群可满足动态工作负载需求,定制化超大规模基础设施则专为大规模模型训练和推理设计。目前,基于MI355的15兆瓦算力集群已正式投入运营。
针对不同应用场景,Zyphra推出差异化服务方案。其推理云服务聚焦于大型混合专家(MoE)模型及长上下文处理任务,特别优化了具有大容量KV缓存和长前缀缓存的代理工作负载。通过与TensorWave合作,该平台已实现对Kimi-K2.6、DeepSeek-V3.2、GLM-5.1等前沿开源模型的支持。在定价策略上,公司采用阶梯式收费模型,根据GPU使用时长和模型复杂度动态调整费用。
技术优化方面,Zyphra研发团队提出四项创新方案:树状注意力机制通过平衡树结构简化长上下文处理;TSP技术维持节点内部模型并行组的稳定性;跨内核、HIP图和RCCL的联合调优提升计算效率;针对ROCm架构优化的EAGLE推测性解码算法则显著降低推理延迟。这些优化在长上下文场景中效果尤为突出——随着输入序列长度增加,性能提升幅度呈指数级增长,有效缩小了与英伟达B200芯片的性能差距。
硬件配置对比显示,MI355X搭载的288GB HBM3E显存较B200的180GB具有显著优势。这种内存容量差异直接转化为实际应用中的性能提升:在GLM 5.1、DeepSeek-V3.2等模型上,MI355X的单节点HBM内存预算实现翻倍,支持更大规模的模型驻留和更长上下文处理,同时保持更低的延迟水平。特别在DeepSeek-V4-Pro(即将发布)的测试中,1.6T参数规模和1M上下文长度的模型运行表现突出。
技术路线图显示,Zyphra正推进多项关键研发:服务引擎将升级支持训练信息量化技术,解码模块将引入基于扩散模型的推测器架构。在硬件合作层面,公司已启动对AMD下一代MI450系列芯片的适配工作,计划构建覆盖从当前MI355X到未来产品的完整技术栈。这种软硬件协同优化策略,使其在AI推理市场形成差异化竞争力。










