近日,AI领域迎来了一则重大消息,DeepSeek公司正式推出了其V3.1大模型的最新版本,并在评论区透露了一个关键信息:UE8M0 FP8格式是专为即将面世的国产芯片设计的。这一言论迅速在国产芯片算力市场掀起了波澜。
受该消息影响,A股市场午后表现强劲,沪指成功突破3800点大关,创下自2015年8月20日以来的新高。创业板指同样表现不俗,涨幅达到3.36%。市场热点聚焦于算力和芯片领域,相关股票迎来了一波上涨行情。
其中,寒武纪股价触及涨停,市值逼近5200亿元大关,股价飙升至1243.20元。中芯国际同样表现抢眼,A股涨幅达到14.19%,港股也上涨了9.86%。
在DeepSeek发布的官方文档中,详细介绍了V3.1版本所使用的UE8M0 FP8 Scale参数精度。相较于V3版本,V3.1在分词器和聊天模板方面进行了较大幅度的调整,呈现出显著差异。因此,对于有部署需求的用户,DeepSeek建议仔细阅读新版说明文档。
那么,UE8M0 FP8究竟是什么呢?根据DeepSeek的解释,这是一种专为人工智能计算设计的数值精度格式,特别适用于大模型的训练和推理。UE8M0 FP8是8位浮点数格式的一种变种,专为矩阵运算和AI计算进行了优化。
具体而言,UE8M0中的“U”代表无符号,即所有数值均为正数;“E8”表示8位指数位,用于表示数值的规模;“M0”则表示0位尾数位,即没有尾数位,尾数默认为1。在AI计算中,UE8M0通常作为缩放因子与其他FP8格式配合使用。
DeepSeek之所以在V3.1版本中采用UE8M0 FP8格式,主要是为了优化国产AI芯片的计算效率。UE8M0的数值均为2的幂,这使得乘法计算可以简化为指数加法,从而大幅降低计算复杂度,提升计算速度,并减少芯片面积和功耗。FP8格式相较于FP16或FP32格式,可以减少50%-75%的显存占用和带宽需求,使得国产芯片能够支持更大规模的模型或更长的上下文。
关于UE8M0 FP8将适配哪些国产芯片的问题,目前尚未有确切答案。不过,市场猜测主要集中在8月13日中国信通院发布的“首批通过DeepSeek适配测试名单”中的8家企业。同时,也有部分猜测基于过往公开信息,盘点了已经宣布支持或适配UE8M0 FP8标准的国产芯片厂商。
业内对此消息表示高度兴奋,认为DeepSeek模型与国产芯片的紧密适配不仅具有技术意义,更在于推动构建了一个自主可控的“模型-芯片-系统-应用”全栈国产化AI生态。这一趋势将倒逼国产芯片在设计、存储、光模块、封装测试等全链条进行技术升级,为中国AI生态的自主化进程注入强劲动力。
也有网友调侃称,DeepSeek的这一言论是否背后有其量化投资公司幻方的推波助澜,引发了市场的一波猜测和热议。