ITBear旗下自媒体矩阵:

北大系「寒序科技」流式推理芯片突破,完成数千万融资直指2000 Tokens每秒

   时间:2026-03-09 09:37:55 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

国内AI芯片领域迎来一匹黑马——专注于超快流式推理芯片研发的「寒序科技」宣布完成数千万元融资,本轮投资由启高资本与赛意产业基金联合领投,源合资本担任独家财务顾问。这家成立不足两年的初创企业,凭借其独特的芯片架构设计,正在挑战传统GPU在AI推理市场的统治地位。

据技术披露,寒序科技首代SpinPU-E系列芯片样片已通过性能验证,其核心指标「单位面积带宽」达到100 GB/s/mm²,与Groq公司公布的LPU(语言处理单元)参数持平。这一数据直接支撑起每秒2000Tokens的推理速度,较当前主流对话模型30-50Tokens/s的性能提升近两个数量级。更引人注目的是,其第二代芯片已进入流片阶段,通过集成片上MRAM与SRAM混合存储架构,配合确定性流式乘加单元设计,目标直指2000Tokens/s以上的突破性表现。

行业观察人士指出,寒序科技的技术路径与NVIDIA最新动向形成微妙呼应。近期市场盛传,NVIDIA将以200亿美元估值与Groq达成技术合作,计划在2026年GTC大会上发布的下一代AI推理系统中采用类似架构。而寒序方案因其超大带宽流式处理特性,被业界视为最接近该技术路线的国产方案。这种技术契合度,在当前中美科技竞争背景下显得尤为敏感。

与传统GPU厂商的"全栈通吃"策略不同,寒序科技从创立之初就确立了"极致推理速度"的产品哲学。公司核心团队脱胎于北京大学磁学中心,由物理学家、材料专家与芯片工程师组成跨界团队,完整覆盖从基础材料研究到芯片架构设计的全链条。这种技术纵深使其敢于放弃通用训练市场,将所有资源聚焦于推理场景的带宽优化与延迟压缩。

知情人士透露,本轮融资资金将主要用于第三代芯片的研发迭代与量产准备。目前寒序科技已启动新一轮融资谈判,其技术验证的关键阶段风险已基本解除。随着大模型应用从训练主导转向推理驱动,这类专精型芯片厂商正获得资本市场前所未有的关注度。

在AI算力军备竞赛持续升级的背景下,寒序科技的选择折射出行业新趋势:当通用芯片陷入参数规模竞赛时,垂直场景的专用架构可能成为破局关键。其技术路线能否经受住量产考验,将直接影响国内AI基础设施的自主化进程。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version