ITBear旗下自媒体矩阵:

出身商汤的曦望:押注推理GPU,三年构建三代芯片矩阵谋突破

   时间:2026-01-23 06:21:24 来源:天脉网编辑:快讯 IP:北京 发表评论无障碍通道
 

在高性能GPU及多模态推理芯片领域,一家名为曦望的新兴企业正以独特的技术路线和战略布局引发行业关注。这家脱胎于商汤科技大芯片部门的公司,自2024年底独立运营以来,已构建起覆盖视觉推理、通用计算及超低功耗场景的三代芯片产品矩阵,其"纯推理"技术路线与英伟达等传统厂商形成鲜明对比。

技术团队构成彰显着这家企业的专业底色。200余人的正式员工中,80%为技术研发人员,核心骨干平均拥有15年行业经验,硕士及以上学历占比超八成。董事长徐冰作为商汤科技联合创始人,曾主导完成超66亿美元融资及港交所IPO;联席CEO王勇兼具AMD首席架构师与百度昆仑芯核心架构师双重背景,主导过多款7nm芯片全流程开发;另一位联席CEO王湛则是百度创始团队成员,在芯片商业化领域拥有16年实战经验。

区别于行业主流的"训推一体"架构,曦望选择专注推理场景优化。通过重构调度机制、缓存设计及片上SRAM架构,融合LPDDR内存技术,其芯片在单位Token推理成本上实现数量级突破。据技术白皮书披露,正在研发的S3芯片将原生支持FP8/FP4低精度计算,目标将百万Token推理成本压缩至1分钱,较现有方案降低90%以上。

产品迭代轨迹印证着企业的技术积累。2020年量产的S1芯片作为国内首款视觉推理专用芯片,已向索尼、小米等企业授权IP;2024年推出的S2芯片实现CUDA生态兼容,成功适配DeepSeek、Qwen等主流模型;即将在2026年面世的S3芯片则定位"推理性价比之王",在能耗控制与计算密度上达到行业新高度。这种三代产品协同发展的格局,使其能够覆盖从边缘设备到数据中心的完整推理场景。

商业落地层面,曦望已形成IP授权与芯片销售双轮驱动模式。S1芯片通过IP授权方式进入消费电子领域,S2芯片则直接切入AI算力市场,与多家云服务提供商达成合作意向。据内部人士透露,过去四年20亿元的研发投入,主要聚焦在编译器优化、芯片互联等底层技术创新,这些积累正在转化为显著的成本优势。

"当推理成本下降90%,我们改变的不仅是芯片市场格局,更是整个AI产业的成本结构。"王湛在近期技术分享会上强调。这种以极致性价比重构产业生态的思路,正吸引着越来越多合作伙伴加入其生态体系。随着S3芯片量产临近,这场由推理芯片引发的产业变革或将进入新的阶段。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version