滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

国产算力新突破！面壁智能开源BitCPM-CANN，1.58-bit训练显存节省超80%

时间：2026-05-26 00:25:39 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

AI大模型发展正面临双重挑战：一方面，AI专用HBM内存价格在2026年出现超165%的暴涨，显存资源成为制约模型扩展的关键瓶颈；另一方面，高端AI芯片对华出口管制持续升级，国产算力生态在供应链安全与成本压力的双重夹击下艰难突围。在此背景下，国产模型厂商开始探索硬件受限环境下的创新路径。

在华为昇腾开发者大会上，面壁智能联合清华大学、OpenBMB开源社区发布全球首个完全基于国产昇腾平台训练的三值（1.58-bit）大模型BitCPM-CANN。该模型实现0.5B至8B全尺寸开源，推理显存需求较传统方案降低83%，在数学、代码等高精度任务中仍保持全精度模型97%以上的性能表现。这项突破标志着国产算力生态在低比特量化训练领域取得系统性进展。

技术实现层面，研发团队构建了三层创新体系：通过直通估计器（STE）方案将离散权重嵌入昇腾训练算子，在梯度更新阶段保留全精度残差；部署完整的量化感知训练（QAT）与后训练蒸馏流程，将训练吞吐量损失控制在5%以内；基于Megatron-LM框架开发可插拔的QAT并行线性层，形成支持32K长序列训练的标准化基础设施。这种技术路径使每个参数仅需1.58bit存储，信息密度较传统8位量化提升3倍。

端侧应用场景展现显著优势。以8B模型为例，传统BF16格式需要16GB显存，而BitCPM-CANN仅需2-3GB。这种压缩效率使得高端对话模型可直接部署于旗舰手机，结合MoE架构未来有望将60B参数模型带入移动终端。高通新一代端侧芯片已原生支持2-bit以下低比特推理，与该模型形成技术协同。值得注意的是，整个训练流程完全在昇腾平台原生完成，不依赖英伟达CUDA生态，填补了国产NPU在大规模三值量化训练领域的空白。

这项突破源于面壁智能在端侧AI领域的长期积累。其开发的"小钢炮"系列模型（MiniCPM）在GitHub获得超3万星标，Hugging Face平台下载量突破3000万次。面对2022年国产芯片训练能力不足的现状，团队选择自主开发训练框架BM-Train，逐步构建起覆盖稀疏架构、低比特量化、推理优化的全栈技术体系。这种技术积累使其能够快速将1.58-bit训练方法移植到昇腾平台，形成从底层算子到训练框架的完整解决方案。

在国产芯片生态建设方面，面壁智能与华为昇腾、鲲鹏及寒武纪、天数智芯等企业展开深度合作，参与优化多个国产芯片软件栈。这种跨平台经验使其建立起独特的技术认知，既能准确识别硬件瓶颈，又能开发针对性优化方案。例如在BitCPM-CANN项目中，团队通过统一checkpoint格式和分布式训练调度，解决了异构计算环境下的协同问题。

当前行业普遍遵循Scaling Law追求算力扩张，而BitCPM-CANN的实践提供了另一种发展范式：通过提升模型信息密度突破硬件限制。该模型在昇腾平台的完整跑通，证明国产算力生态具备支撑前沿AI技术研发的能力。随着60B参数端侧模型的技术路线逐渐清晰，移动终端的AI应用场景正迎来新的发展机遇。

IT之家 7 月 9 日消息，Rambus 当地时间本月 8 日宣布推出支持 9600MT/s 的新一代 DDR5 RDIMM内存条芯片组解决方案。其面向新一代算力基础设施，支持的传输速率相较上代产品提升…

07-09

刘东谈AI基建新路径：从算力扩张迈向算力网络数据模型协同共进

围绕AI基础设施建设路径，刘东指出，下一步AI基础设施建设不能简单理解为算力规模扩张，更要形成算力、网络、数据和模型协同发展的体系能力。当前，算力供给、网络连接、数据流通、模型训练推理和行业应用正在共同构成…

07-09

中国电信天翼智安2.0发布：以“1+1+X”体系护航智能体安全发展

（记者杜峰）7月8日，在2026中国互联网大会“智能体安全发展论坛”上，中国电信正式发布天翼智安2.0产品体系，作为天翼智安产品的一次系统性升级，标志着AI安全防护正式从“生成安全”迈入“执行安全”新阶段…

07-09

中国移动李慧镝：以高阶自智网络为笔，绘就数字产业发展崭新画卷

李慧镝表示，信息通信行业正在推动AI与网络深度融合——AI赋能网络的同时，网络也在拓宽AI规模化落地边界。同时，中国移动打造了一系列自智网络标杆实践：基于5G-A+AI融合注智，打造差异化确定性网络服务…

07-09

“00后”唐晨宇：本科毕业四年即任北大博导深耕人工智能与健康技术领域

近日，极目新闻记者发现，北京大学信息工程学院官网显示，此前入职该院担任助理教授的唐晨宇，目前已任博士生导师，他的招生信息写道：“欢迎对智能感知、生物电子与智慧健康技术方向感兴趣的学生和博士后加入！” 本科期间…

07-09

“⾖包⼿机”之后，国内头部AI⼤模型公司下场做终端

07-09

Claude Fable 5比DeepSeek V4 Pro高12分，每任务成本超100倍

07-09

消息称“全球首款机器人手机”荣耀Robot Phone手机8月上市

07-09

“阶跃星辰”公号改名

07-09

全球首次：人形机器人完成活体胆囊切除手术

07-09

刘东：AI时代竞争升级数据空间成智能互联网发展核心底座

在演讲中，刘东系统阐释了数据空间支撑人工智能发展的五项关键能力：一是建立身份认证与意图认证相结合的信任链，既确认“谁在访问”，也确认“为何访问”；二是通过元数据、数据目录、接口标准和语义映射，构建多源异构的…

07-09

利空出尽估值洼地凸显，股东“惜售”极智嘉（2590HK）迎布局良机

07-09

65岁李开复的转身：从AGI理想到企业AI实战，深入一线寻新机

07-09

鼎泰高科7月9日登陆港股实现“A+H”上市募资近48亿引16名基石投资者

07-09

AI发展：智能提升之外，更需筑牢现实世界的“边界防火墙”

07-09

点击查看更多 +

全站最新

AItab来袭：AI时代上网新选择，打造高效愉悦一站式入口

刘东：AI时代竞争升级数据空间成智能互联网发展核心底座

小米汽车新序列“澎程”亮相！SkyNomad首车定位智能大空间SUV

小米汽车新系列SkyNomad内饰初揭秘：两辐方向盘+可移动扶手台成亮点

小米澎程SUV空间大揭秘：可变布局引热议，吉利这次要如何接招？

雷军发声打破传统认知：车内空间要灵活可变，小米澎程SUV开辟新赛道

热门内容

本栏最新

刘东：AI时代竞争升级数据空间成智能互联网发展核心底座

30万级新选择！全新奔驰纯电GLC上市，硬核技术破解纯电出行难题

十五万预算新选择！吉利银河星耀7 MAX四驱电混，性能舒适智能全拉满

拒绝“速成”与营销噱头全新奔驰纯电GLC以严苛标准重塑电动豪华格局

蚂蚁灵波LingBot-World 2.0开源：小时级生成+Agent机制，开启实时交互新篇章

刘东：AI基建需构建算力网络数据模型协同体系推动可持续发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.