ITBear旗下自媒体矩阵:

后摩智能吴强发布M50:存算一体大模型AI芯片,能效比刷新业界记录

   时间:2025-07-28 15:19:40 来源:量子位编辑:快讯团队 IP:北京 发表评论无障碍通道
 

在人工智能界沉寂两年的后摩智能,终于在今年WAIC大会上重归公众视野。这家公司的CEO,吴强博士,带着他们的最新研发成果——后摩漫界®M50,一款在能效比上刷新行业纪录的存算一体端边大模型AI芯片,再次吸引了业界的目光。

M50的表现堪称惊艳,其物理算力高达160TOPS@INT8,浮点算力达到100TFLOPS@bFP16,同时拥有153.6 GB/s的超高带宽和最大48GB的内存,而这一切仅需10W的典型功耗,相当于一部手机的快充功率。吴强表示,他们希望大模型算力能像电力一样,无处不在,随时可用,无论是生产线、设备还是每个人的指尖。

回溯两年前,后摩智能带着他们的第一代存算一体芯片首次亮相WAIC,便引起了业界的广泛关注。两年后,面对大模型时代带来的新挑战,他们选择了继续深耕存算一体这一在当时看来颇为“冷门”的领域,并再次取得了业界领先的成绩。

M50之所以能取得如此高的能效比,得益于后摩智能在存算一体技术上的持续创新和突破。M50采用的是后摩智能自研的第二代SRAM-CIM(基于SRAM的存内计算)技术,这一技术将计算和存储单元融合,从根本上解决了传统冯·诺依曼架构中数据来回搬运的问题,从而大大提高了效率。

后摩智能还自研了全新的第二代IPU(AI处理器)架构——天璇,针对大模型的计算特点进行了大量优化。其中,弹性计算(Elastic Computing)或自适应计算技术,让后摩智能的SRAM存算能实现更细粒度的优化,即使在权重不为“0”的情况下也能实现加速,大大提高了性能。同时,天璇架构还在业内首次实现了在存算架构上直接进行浮点运算,并成功量产,大大降低了应用落地的门槛和开发周期。

与M50配套的,是后摩智能新一代编译器工具链——后摩大道®。这款完全重构的编译器,支持细颗粒度的算子,能将复杂的算子自动拆分、组合和优化,大大减轻了开发者适配和部署的负担。

为了让M50的算力以最便捷的方式触达不同场景,后摩智能还推出了一系列硬件产品,构建了覆盖终端与边缘的完整产品矩阵。包括力擎TM系列M.2卡,可以“即插即用”地为AI PC、AI Stick等移动终端提供强大的本地AI能力;以及力谋®系列加速卡及计算盒子,面向对算力有更高要求的边缘计算场景。

吴强表示,选择存算一体技术,既是差异化竞争的必然选择,也是技术发展的必然趋势。面对英伟达、华为这样的巨头,初创公司需要创新的架构才有可能实现弯道超车。而大模型时代对算力和带宽的需求空前高涨,存算一体技术既能提升算力密度,又能提升带宽,完美契合了大模型应用的需求。

近年来,后摩智能陆续获得了中国移动、北京人工智能基金等重量级产业方和国有资本的投资,为持续的研发创新提供了坚实的后盾。从两年前的崭露头角,到如今的厚积薄发,吴强和他的后摩智能,正以坚定的步伐,在存算一体这条道路上不断前行。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version