在2025年度的世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)上,全球科技界的目光聚焦于上海。此次大会以“智能时代,全球携手前行”为核心议题,汇聚了来自30多个国家和地区超过1200位顶尖嘉宾,包括图灵奖、诺贝尔奖得主12人,中外院士80余位,以及多个国际知名实验室的代表。
展览区域同样引人注目,总面积首次突破7万平方米,吸引了800多家企业参展,展示了超过3000项前沿科技产品。其中,40余款大型AI模型、50余款AI终端设备、60余款智能机器人,以及超过100款的“全球首发”或“中国首秀”新品,成为本次展览的亮点。
会议期间,国内领先的端边大模型AI芯片企业后摩智能,正式发布了其最新的端边大模型AI芯片——后摩漫界M50。同时,公司还推出了力擎系列M.2卡、力谋系列加速卡及计算盒子等硬件产品,形成了一个覆盖移动终端与边缘场景的完整产品线。
M50芯片作为国内首颗专为端边大模型设计的存算一体AI芯片,具备强大的计算能力。它提供了160TOPS(INT8)和100TFLOPS(bFP16)的物理算力,搭配最大48GB内存和153.6 GB/s的高带宽,而典型功耗仅为10W。这意味着,从PC到智能语音设备、机器人等智能移动终端,都可以借助M50芯片高效运行参数规模从1.5B到70B的本地大模型。与传统架构相比,M50的能效提升了5至10倍,真正实现了高性能、低能耗和即插即用的特点。
后摩智能CEO吴强在会后与媒体交流时透露,公司研发的端边推理加速卡已经能够适配参数规模从7B到70B的DeepSeek模型,芯片的性能上限约为100B参数。公司正在与中国移动合作研发一体机产品。吴强认为,具身智能机器人领域的发展潜力巨大,类似于十年前的智能驾驶领域,目前正处于起步阶段,竞争格局尚未确定。他预计,一旦具身智能机器人技术成熟,其市场规模将远超智能驾驶。
后摩智能自2020年成立以来,一直致力于利用先进存储器件等技术开发存算一体的大算力智能芯片,提供高能效比、低成本的解决方案。公司创始人吴强拥有丰富的行业经验,曾在AMD和Facebook工作,并担任过地平线公司的CTO。目前,后摩智能的团队中硕博学历占比超过70%。
存算一体技术通过在存储器中嵌入计算能力,打破了传统冯诺依曼架构中计算单元与存储单元之间的界限,解决了存储墙问题,成为后摩尔时代的一项关键技术。据预测,到2030年,中国存算一体芯片市场的规模将超过1100亿元。
自成立以来,后摩智能已经完成了四轮融资,吸引了包括红杉资本中国基金、启明创投、经纬创投、联想创投、和玉资本、金浦投资等多家知名投资机构。最近一轮融资是在2024年7月,由中国移动旗下的两只基金共同投资。
在鸿途H30发布两年后,后摩智能决定全面转型,专注于端边大模型AI算力领域。其研发的端边AI芯片将广泛应用于Pad、PC、智能语音设备、机器人等多种终端,以及一体机、计算盒子、工作站等智能边缘设备,覆盖消费终端、智能办公、智能工业等多个领域。
吴强坦言,这个转型过程充满了挑战。他认为,存算一体技术与大模型之间存在许多契合点,但市场需求的快速变化给研发工作带来了巨大压力。在智能驾驶领域,市场竞争日益激烈,格局逐渐稳定,新入局者面临的机会越来越少。同时,市场对低成本、高效率的需求日益增强,而后摩智能早期研发的高算力芯片在当时显得过于超前和冗余。
面对这些挑战,吴强表示,生存的压力最终促使公司选择了转型。他们迅速调整了第一代芯片,推出了M30,并得到了中国移动的大力支持。通过与中国移动的合作,后摩智能用M30运行了600亿参数的大模型,获得了更多信心,坚定了存算一体与大模型结合的方向。在不到两年的时间里,后摩智能成功推出了M50芯片,并规划了下一代产品的研发。
吴强还介绍了后摩智能的新产品,包括集成2颗和4颗M50芯片的力谋LM5050和力谋LM5070加速卡,它们为单机和超大模型推理提供了高密度算力,最高可达640TOPS。M50芯片的存算一体技术正在不断探索DRAM-PIM的产品化。