在2025年世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)的热烈氛围中,全球科技精英汇聚上海,共襄盛举。本次大会以“智能时代,全球携手前行”为核心理念,吸引了来自超过30个国家和地区的1200多位嘉宾,其中包括图灵奖、诺贝尔奖得主12人,中外院士80余位,以及众多国际顶尖实验室的代表。
展览区域更是规模空前,总面积首次突破7万平方米,汇聚了800多家参展企业,集中展示了3000多项前沿技术产品。其中,40余款大模型、50余款AI终端产品、60余款智能机器人,以及超过100项的“全球首发”或“中国首秀”新品,成为展会亮点。
在WAIC大会期间,国内领先的端边大模型AI芯片企业后摩智能,震撼发布了其全新力作——后摩漫界M50 AI芯片。这款芯片不仅是国内首颗面向端边大模型的存算一体芯片,还配套推出了力擎系列M.2卡、力谋系列加速卡及计算盒子等硬件组合,形成了覆盖移动终端与边缘场景的完整产品线。
M50芯片在性能上表现卓越,拥有160TOPS(INT8)和100TFLOPS(bFP16)的物理算力,搭配最大48GB内存和153.6 GB/s的超高带宽,而典型功耗仅为10W,相当于手机快充功率。这使得PC、智能语音设备、机器人等智能移动终端能够高效运行参数规模从1.5B到70B的本地大模型。相比传统架构,M50在能效上提升了5-10倍,真正实现了“高算力、低功耗、即插即用”的理想状态。
后摩智能CEO吴强在会后媒体交流时透露,公司研发的端边推理加速卡已经能够适配从7B到70B的DeepSeek模型,芯片上限可达到约100B参数规模。公司正在与中国移动合作研发一体机产品。吴强认为,具身智能机器人领域正如十年前的智能驾驶一样,处于刚刚起步的阶段,是一个充满潜力的新兴垂直赛道,竞争格局尚未确定,仍有许多机会等待挖掘。一旦具身智能机器人得到发展,其市场潜力将远超智能驾驶。
后摩智能自2020年成立以来,一直致力于利用先进存储器件等技术研发存算一体大算力智驾芯片,提供高能效比、低成本的芯片及解决方案。公司创始人吴强毕业于美国普林斯顿大学,曾在AMD、Facebook等公司任职,并担任过地平线公司CTO。目前,后摩智能的团队中硕博占比超过70%。
存算一体技术(Computing in Memory)通过在存储器中嵌入计算能力,以全新的运算架构进行二维和三维矩阵乘法/加法运算,打破了冯诺依曼架构中计算单元与存储单元过于独立导致的“存储墙”问题,解决了算力发展速度远超存储、存储带宽限制计算系统速度等难题,成为后摩尔时代下新的技术发展路径。据预测,到2030年,中国存算一体芯片市场规模将超过1100亿元。
自成立以来,后摩智能已经完成了四轮融资,吸引了包括红杉资本中国基金、启明创投、经纬创投、联想创投、和玉资本、金浦投资等机构在内的投资。最近一轮融资是在2024年7月,由中国移动旗下的北京中移数字新经济产业基金和上海中移数字转型产业基金共同投资。
在鸿途H30发布两年后,后摩智能全面转型并聚焦端边大模型AI算力赛道。其研发的端边AI芯片将广泛应用于Pad、PC、智能语音设备、机器人等多种终端设备,以及一体机、计算盒子、工作站等智能边缘设备上,覆盖消费终端、智能办公、智能工业等多个领域。
吴强坦言,这个转型过程充满了挑战和痛苦。从2023年下半年开始,他意识到智能驾驶赛道可能面临瓶颈,整个自动驾驶领域竞争日益激烈,格局逐渐稳定,新入局者的机会越来越少。为了体现存算一体的优势,一代芯片算力设计得过大,却忽略了当时的市场需求,导致算力冗余、成本高企。在行业普遍追求低成本、高性价比的背景下,这种差距愈发明显。因此,后摩智能选择了转型,将重心转向端边大模型领域。
吴强表示,力谋LM5050加速卡与力谋LM5070加速卡分别集成了2颗和4颗M50芯片,为单机及超大模型推理提供高密度算力,最高可达640TOPS。M50芯片的存算一体技术一直在不断探索DRAM-PIM的产品化。