在AI芯片领域,一场技术革命正悄然发生。存算一体技术,这一曾被视为颠覆冯·诺依曼架构的创新,如今正逐步成为大模型时代设计AI芯片的关键路径。它打破了传统的“存储墙”和“功耗墙”,实现了计算单元与存储单元的完美融合。
四年前,当吴强基于存算一体技术创立后摩智能时,这一创新并未被广泛接受。面对外界的质疑,吴强和他的团队坚持了下来。四年后的今天,随着大模型技术的崛起,存算一体技术的优势逐渐显现,主流芯片厂商也纷纷涉足这一领域。面对竞争,吴强给出了后摩智能的答案——后摩漫界M50,一款专为端边大模型设计的AI芯片。
吴强的创业之路始于他对存算一体技术的深刻洞察。在美国普林斯顿大学攻读博士期间,他就致力于研究高能效比芯片和编译器,深知存算一体是解决“存储墙”、“功耗墙”问题的必由之路。而在芯片领域,要想在全球竞争中脱颖而出,创新技术无疑是弯道超车的关键。于是,吴强带领后摩智能团队,踏上了这条充满挑战的创新之路。
2023年,后摩智能推出了首款存算一体芯片鸿途H30,这款应用于智驾领域的芯片以其高算力、高带宽、低功耗等特性初露锋芒。然而,智能驾驶市场的格局变化让后摩智能不得不重新审视市场定位。在L3级乃至更高阶自动驾驶尚未普及的年代,算力成本成为了市场的主流声音。面对这一挑战,后摩智能开始寻找新的机会。
2023年,ChatGPT的火爆让大模型市场迎来了百团大战。吴强敏锐地察觉到,大模型既是算力密集型,又是访存密集型的AI应用,这与存算一体计算架构的技术能力高度契合。于是,后摩智能决定转向,基于大模型的应用需求研发存算一体AI芯片。经过两年的技术积累,后摩漫界M50终于在WAIC 2025期间正式亮相。
M50芯片采用了存算一体计算架构,大小仅为20×23mm,典型功耗控制到了10W,单芯片算力最高可达160TOPS。它不仅支持7B/8B大模型,还完成了对70B参数的deepseek的适配,最大可以支持100B参数大模型。这样的性能表现,得益于后摩智能在存算一体化计算架构上的技术突破,包括存算IP和IPU架构的优化。
在存算IP上,后摩智能演进到了第二代,对权重加载电路、加法树架构等方面进行了全新的优化设计。在IPU架构上,第二代天璇架构通过自适应计算周期压缩实现弹性加速,以及浮点模型直接运行等技术创新,提升了应用效率。为了更好地发挥出M50芯片的能力,后摩智能还重构了编译器工具,研发了支持主流深度学习框架的后摩大道编译器。
随着大模型时代的到来,产品的底层逻辑已经发生改变。大模型产品可以在很短的时间内成长为超级应用,直接创造生产力。在这样的背景下,后摩智能将目标商业市场定位在了消费终端、智能办公、智能工业、机器人等领域。吴强透露,联想的下一代AI PC、讯飞听见的下一代智能语音设备、中国移动的5G+AI应用落地设备等都将是后摩智能的意向客户。后摩智能还在与机器人厂商合作,提前布局具身智能市场。
后摩智能的M50芯片及其配套硬件组合,形成了覆盖移动终端与边缘场景的完整产品矩阵。这不仅展示了后摩智能在存算一体技术上的深厚积累,也预示着AI终端市场的潜力正在加速释放。随着大模型技术的不断发展和普及,后摩智能有望在这一领域取得更大的突破和成功。