ITBear旗下自媒体矩阵:

曦望完成近30亿融资:聚焦推理GPU,剑指降低大模型推理成本与门槛

   时间:2026-01-23 04:30:39 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

GPU芯片行业迎来一笔重量级融资。近日,专注于推理场景的GPU芯片企业曦望(Sunrise)对外披露,公司已在过去一年内完成总额近30亿元的战略融资。本轮投资阵容涵盖产业资本与财务投资者,包括三一集团旗下华胥基金、协鑫科技、正大机器人等产业方,IDG资本、高榕创投、中金资本等知名机构,以及具备国资背景的诚通混改基金等。

作为国内首家完全聚焦推理场景的GPU芯片设计公司,曦望的前身可追溯至商汤科技的大芯片研发部门。2020年独立运营后,公司确立了高性能GPU及多模态推理芯片的研发方向,核心团队由前AMD、昆仑芯首席架构师王勇与百度集团前副总裁王湛共同领衔。其中,王勇带领的百人技术团队曾主导完成两代芯片的量产落地,王湛则负责推动产品商业化进程。

技术路线选择上,曦望采取差异化竞争策略。区别于行业普遍追求的训推一体架构,公司针对推理场景的特殊需求,对GPU底层架构进行重构优化。通过改进调度算法、缓存机制、片上存储及互联架构,配合编译器路径的针对性调整,成功将单位Token推理成本降低至行业平均水平的三分之一。这种技术路径源于对训练与推理本质差异的深刻认知——前者需要极致算力支撑参数迭代,后者则更强调多场景适配下的能效比与响应速度。

产品布局方面,曦望已构建覆盖全场景的推理芯片矩阵。首款云边端视觉推理芯片S1实现量产出货超2万片,第二代大模型推理芯片S2不仅完全兼容CUDA生态,其性能指标更可对标英伟达A100。正在研发的第三代产品S3将重点突破多模态大模型推理,计划通过架构创新将计算成本压缩至现有水平的十分之一,预计2026年进入量产阶段。

团队构成显示,曦望汇聚了来自NVIDIA、AMD、昆仑芯等企业的技术精英,目前规模已突破300人。值得注意的是,这并非该公司首次获得资本青睐——今年7月,其已完成规模近10亿元的Pre-B轮融资,投资方包括第四范式、游族网络等产业资本及松禾资本等财务投资者。

在商业化落地层面,曦望的推理专用GPU展现出独特优势。通过平衡通用性与性价比,其产品能够为AI大模型提供更低功耗、更高稳定性的推理服务。联合CEO王湛指出:"当推理成本下降90%时,我们改变的不仅是芯片市场的竞争格局,更是整个中国AI产业的成本结构。我们的使命是让算力像水电一样触手可及,从而释放通用人工智能的全部潜能。"

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version