ITBear旗下自媒体矩阵:

安谋科技Arm China“周易”X3 NPU亮相:多项创新,端侧大模型推理更高效

   时间:2025-11-18 13:46:42 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国内芯片IP设计与服务领域的领军企业安谋科技近日在上海举办新品发布会,正式推出新一代“周易”X3 NPU,标志着其“All in AI”产品战略进入实质性落地阶段。这款专为端侧AI计算设计的处理器,凭借多项技术创新成为全场焦点,其性能指标与架构设计均达到行业领先水平。

作为安谋科技自研IP矩阵的核心成员,“周易”X3 NPU采用专为大模型优化的DSP+DSA通用架构,首次实现CNN与Transformer架构的深度融合。该架构支持单Cluster丛簇配置最多4个核心,FP8算力覆盖8至80 TFlops区间,核心带宽高达256GB/s。这种设计使其能够灵活适配从智能汽车到移动终端的多样化场景,为AI加速卡、智能座舱、ADAS系统等提供端侧计算支持。

架构层面的突破性创新体现在四大核心模块:自研解压硬件WDC通过软件无损压缩技术,将等效带宽提升15-20%;新增的W4A8/W4A16计算模式专为大模型优化,在保持精度的同时降低带宽消耗;AIFF硬件引擎与专用调度器的组合,使CPU负载降至0.5%以下;多精度融合计算支持INT4/8/16/32及FP4/8/16/32等数据类型,平衡性能与能效的灵活性达到新高度。

实测数据显示,相比前代X2型号,X3在CNN模型性能上提升30-50%,多核算力线性度达到70-80%。在AIGC大模型场景中,其综合性能实现10倍跃升,这得益于FP16算力、核心带宽及Softmax性能的协同优化。以Llama2 7B模型测试为例,Prefill阶段算力利用率达72%,Decode阶段在WDC硬件加持下有效带宽利用率突破100%,显著超越行业平均水平。

配套发布的“周易”Compass AI软件平台构成完整解决方案。该平台通过NN Compiler神经网络编译器整合模型解析、优化、生成等全流程工具,支持超过160种算子与270种模型。其创新性的Hugging Face“一键部署”功能,可直接处理主流AI框架模型,配合动态shape支持与多样化量化方案,将开发门槛降低60%以上。平台还提供Bit精度仿真环境与多层次调试工具,支持Android、Linux等操作系统及SoC异构计算。

发布会现场展示了“周易”系列产品的完整布局:Z1型号以0.32-3.75 TOPS算力覆盖AIoT场景,已应用于智能音箱等产品;Z2/Z3型号支持1.25-5 TOPS算力,面向入门级座舱市场;X1型号10 TOPS算力服务高端AIoT设备;X2型号在10-30 TOPS区间实现端侧多模态运行,现场演示了Stable Diffusion文生图功能;最新X3型号则通过8-80 FP8 TFLOPS算力,在DeepSeek-R1-Distill等主流大模型上展现出实时文生文、图生文等交互能力。

安谋科技自2018年组建国内首个NPU研发团队以来,已形成覆盖CPU、SPU、多媒体处理的全栈自研体系。此次“周易”X3的发布,不仅完善了其AI计算产品矩阵,更通过软硬协同的完整生态,为智能汽车、移动终端、物联网等领域的大模型端侧部署提供了关键基础设施。随着AIGC技术向边缘侧渗透,这款具备全栈自主能力的NPU有望成为推动端侧AI普及的重要力量。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version