上海棣山科技近日对外公布了其2纳米高端AI GPU芯片的最新研发成果,标志着国内在先进制程芯片领域取得重要突破。这款芯片采用FinFET与GAA混合制程工艺,结合Chiplet异构集成架构,核心晶体管数量突破1700亿颗,通过2.5D CoWoS-L封装技术实现高密度集成。
性能参数方面,该芯片在FP32单精度算力上达到50万亿次/秒,FP16半精度算力翻倍至100万亿次/秒,而针对低精度计算的FP4模式更实现400万亿次/秒的突破性表现。这种多精度算力配置使其能够灵活适配从大模型训练到实时推理的多样化AI应用场景。能效比优化成为另一大亮点,相比前代产品提升40%,典型功耗控制在350瓦以内,每瓦算力达1420亿次/秒。
研发团队在关键技术领域取得多项突破,成功解决高带宽内存(HBM)与芯片的封装互联难题,实现超低延迟的片间通信。通过支持NVLink 6兼容协议,单链路带宽提升至1.6TB/秒,多芯片互联时可消除算力瓶颈,形成协同运算的超级计算单元。软件生态兼容性方面,该芯片全面适配CUDA计算架构,为下游客户提供平滑的技术迁移路径,显著降低开发成本。
目前该芯片已完成原型设计验证,各项指标均达到国际领先水平。公司负责人表示,这款产品将重点面向数据中心、超算中心等高端算力市场,通过架构创新与工艺突破,为AI大模型训练提供更具性价比的解决方案。随着后续测试工作的推进,预计将在年内完成工程样片流片。










