ITBear旗下自媒体矩阵:

国产推理GPU独角兽曦望再获超10亿融资 加速AI推理时代算力布局

   时间:2026-04-21 12:17:39 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国内全栈自研AI推理GPU领域迎来重大突破。曦望科技近日宣布完成超10亿元人民币新一轮融资,公司估值突破百亿元大关,成为该赛道首个跻身独角兽行列的企业。此次融资创下国内纯推理GPU领域单笔融资规模新高,资金将重点投向新一代芯片量产、软件生态构建及后续产品研发。

自2025年初独立运营以来,这家专注于AI推理芯片的企业已累计完成七轮融资,总融资额接近40亿元。其发展轨迹与全球AI产业变革高度同步——随着大模型从对话交互向自主决策演进,推理计算需求呈现指数级增长。行业数据显示,2026年AI推理算力需求已达到训练需求的4-5倍,相关算力租赁价格半年内上涨近40%。

公司董事长徐冰指出,传统GPU架构在推理场景存在显著效率缺陷。以智能体推理为例,其"感知-决策-执行-反馈"的闭环需要高频访问KV缓存,而通用GPU面向训练优化的设计导致实际算力利用率不足30%。曦望通过架构创新破解这一难题,其最新发布的启望S3芯片采用全链路重构设计,单位面积有效算力效率较前代提升5倍以上。

技术突破体现在多个维度:该芯片首次在推理场景引入LPDDR6内存,通过裁剪训练专用模块将晶体管资源集中投入推理计算,使Token生成成本降低90%。在核心算子优化方面,GEMM和Flash Attention的利用率分别达到99%和98%,指令集密度较传统SIMT架构提升3倍。特别针对智能体复杂控制流设计的独立线程调度机制,有效解决了通用GPU在推理场景的算力浪费问题。

量产进程同样取得实质性进展。曦望已实现数万颗GPU的稳定交付,形成从芯片设计到解决方案落地的完整闭环。值得关注的是,其三代产品均保持"一次流片成功"的纪录,且流片后性能完全符合设计预期。这种技术稳定性在半导体行业尤为罕见,为大规模商业化应用奠定了基础。

当前,AI产业正加速从模型训练向应用落地转型。英伟达GTC 2026大会将"每瓦Token吞吐量"确立为新一代算力评价指标,这与曦望的技术路线形成战略共振。随着启望S3进入规模化量产阶段,国内AI推理芯片市场有望打破国外巨头垄断,为智能体普及提供算力支撑。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version