ITBear旗下自媒体矩阵:

UE8M0 FP8精度格式,国产芯片迎来新机遇?

   时间:2025-08-25 02:12:14 来源:华尔街见闻官方编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近期,AI领域迎来了一场不小的震动,起因是DeepSeek V3.1版本发布时的一则官方留言。留言中简短提及了新架构与下一代国产芯片,虽然字数不多,却如同投入湖面的石子,激起了层层涟漪。

国产芯片企业的股价随之波动,其中寒武纪的表现尤为抢眼。在消息发布的当天,寒武纪的股价早盘便大幅攀升,午后更是直接涨停,使其总市值跃升至科创板首位。半导体ETF也在半天内大涨5.89%,市场的热情可见一斑。

在知乎等平台上,众多网友和专业人士纷纷开始探讨这一事件背后的含义。他们发现,DeepSeek所提及的“UE8M0 FP8”是一个关键概念。这个概念可以拆分为两部分理解:UE8M0作为MXFP8路径中的“缩放因子”,而MXFP8则是Open Compute Project在2023年发布的一种8 bit微缩块格式。

MXFP8的核心思想是将张量切割成固定长度的“块”,并为每个块指定一个2的整数次幂作为缩放因子。这种块级的缩放方式,使得MXFP8在保留8 bit位宽的同时,将可用动态范围扩展了几十倍。而UE8M0中的8个bit全部用于指数位,这种全指数表示的缩放因子方式,使得处理器在复原数据时只需移动指数位,无需复杂的浮点乘法、规格化或舍入逻辑,从而缩短了时钟关键路径。

对于国产芯片而言,UE8M0 FP8的优势尤为明显。目前,大部分已量产的国产AI加速器仍沿用FP16/BF16 + INT8的计算通路,并未集成完整的FP8乘加单元。然而,一些新款国产芯片如摩尔线程的MUSA 3.1 GPU、芯原的VIP9000 NPU等,已经在宣传资料中列出了对“原生 FP8”或“Block FP8”的支持,并与DeepSeek等厂商联合验证了UE8M0格式。

市场普遍认为,DeepSeek的这一举动意味着国产AI正逐步走向软硬协同阶段。UE8M0 FP8精度格式所具备的小带宽、低功耗、高吞吐等优势,使得同样的硬件能够运行更大的模型,从而大幅提升了国产芯片的“性价比”。这种软硬协同的模式,无疑将国产芯片拉进了一个统一的生态坐标系,增强了其在市场竞争中的优势。

随着DeepSeek V3.1版本的发布,以及国产芯片对UE8M0 FP8格式的支持,市场反应热烈。国产芯片概念股集体高开,科创50指数大涨8.5%,创下近三年半的新高。芯片产业链整体走强,众多芯片厂商的名字出现在了讨论名单中,市场充满了对未来的期待。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version