AI推理芯片领域迎来新突破,初创企业Positron近日正式对外披露其第二代专用集成电路(ASIC)设计——Asimov芯片。据企业宣称,这款芯片在Token能效与成本效益方面均达到英伟达Rubin GPU的五倍水平,引发行业广泛关注。
与传统GPU设计思路不同,Positron团队将研发重点聚焦于内存架构优化。针对Transformer模型推理过程中内存带宽瓶颈问题,Asimov通过硬件级创新实现90%的内存带宽利用率,同时重构数据流动路径,从芯片架构层面消除冗余的远程数据传输操作。这种设计理念使芯片在处理大规模模型时具备显著优势。
在硬件配置方面,Asimov采用双计算模块架构,每个模块集成432GB LPDDR5x内存,并通过PCIe 6.0与CXL 3.0混合接口连接最高720GB的KV Cache专用缓存。芯片整体热设计功耗(TDP)控制在400W,内存总容量达2304GB,峰值带宽突破2.76TB/s,支持标准风冷散热方案。这种配置使其在保持高算力密度的同时,兼顾了数据中心部署的可行性。
系统级创新同样值得关注。Asimov支持16Tbps芯片间高速互联,可构建多样化拓扑网络。其配套的Titan推理服务器采用19英寸4U标准机架,单系统集成4颗Asimov芯片,能够实时处理16万亿参数规模的模型推理任务,并支持1000万 tokens的上下文窗口。更引人注目的是,该系统支持多机并行扩展,单个数据中心单元最多可部署4096套Titan服务器。
据企业研发路线图显示,Asimov芯片已完成前端设计验证,预计于2026年底进入流片阶段。若进展顺利,这款芯片将于2027年初启动量产,届时或将为AI大模型部署提供新的硬件解决方案。行业分析师指出,这种针对特定工作负载优化的专用芯片,可能对现有GPU主导的市场格局产生冲击。











