安谋科技近日正式推出新一代专为端侧大模型设计的NPU IP——“周易”X3。这款产品通过与Arm架构的CPU、GPU协同工作,构建起基于Arm生态的异构计算解决方案,为端侧AI应用提供更强大的算力支持。
据介绍,“周易”X3在多个关键领域实现突破性升级,包括模型兼容性、硬件架构效率、软件生态适配、算力带宽优化、能效表现以及系统扩展性。安谋科技产品研发负责人表示,该团队自2018年成立以来,已成功交付五代NPU产品,并实现终端领域的商业化应用,所有研发工作均由中国本土团队独立完成。
硬件架构方面,“周易”X3采用DSP+DSA混合架构,支持从定点到浮点的计算转换。其单集群算力范围覆盖8-80TFLOPS(FP8精度),单核带宽最高可达256GB/s。通过配备AI专属硬件引擎AIFF和专用调度器,该方案将CPU负载降低至0.5%,同时显著减少调度延迟。在模型支持能力上,新平台可处理超过160种算子类型,兼容270余种模型架构。
软件生态建设取得重要进展,其Compass AI平台已实现与TensorFlow、ONNX、PyTorch等主流框架的无缝对接,并支持大模型动态Shape处理、GPTQ量化方案、Hugging Face模型库以及LLM、VLM等多元模型类型。性能测试显示,CNN模型处理效率较前代提升30-50%,AIGC大模型处理能力提升近10倍,多核算力线性度达到70-80%,大模型Prefill阶段算力利用率提升至72%,Decode阶段在启用自研解压引擎WDC后有效带宽利用率突破100%。
发布会现场演示了多个应用场景:基于“周易”X3的AI PC可本地运行MinicpM v2.6模型,实现实时图像识别功能;在文生图领域,搭载Stable Diffusion v1.5的设备能以秒级速度生成高质量图像;文生文应用中,DeepSeek-R1-Distill-Qwen-1.5B模型的运行流畅度和响应速度均有显著提升。这些案例表明,新一代产品在性能提升和生态完善的双重作用下,大幅改善了端侧AI的实际使用体验。
目前,“周易”X3已形成覆盖多领域的解决方案矩阵,其应用场景延伸至加速卡、AI PC、智能手机、具身智能、智能座舱、ADAS系统以及智能监控设备等终端产品。该平台通过提供NPU IP授权、开放技术合作和完整解决方案,持续推动本土端侧AI技术的规模化落地。











