在人工智能领域,模型压缩与轻量化正成为行业的新焦点。一家名为Multiverse Computing的初创公司,凭借其独特的“量子瘦身”技术,在这一赛道上脱颖而出。
Multiverse Computing的故事始于2019年,最初专注于量子计算软件在金融领域的应用。然而,随着生成式AI的爆发,大模型参数规模激增,算力成本飙升,Multiverse敏锐地捕捉到了这一行业痛点,并迅速转型,将量子技术与AI压缩相结合。
其核心技术CompactifAI,并非简单采用量化或蒸馏等传统方法削减参数,而是利用量子物理中的张量网络方法,结合张量分解、矩阵低秩近似等复杂数学技巧,从模型底层重构参数逻辑。据Multiverse介绍,这种技术能够将大模型体积压缩95%,同时几乎不损失性能,使得原本只能在数据中心运行的AI模型得以装进手机、汽车等终端设备。
这一技术的突破,不仅让Multiverse踩中了“小模型”风口,更在短短几年内实现了估值的飙升。从2024年的1.08亿美元,到2025年估值达到5亿美元,Multiverse一跃成为西班牙最大的AI初创公司之一。其融资历程也颇为顺利,截至目前已完成5轮融资,其中包括2024年3月的2500万欧元A轮融资,以及一年多后的1.89亿欧元B轮融资。
CompactifAI的商业价值显而易见。它带来的成本与效率优化,让众多企业和开发者受益。根据Multiverse公布的数据,其瘦身版模型推理速度是未压缩模型的4-12倍,推理成本降低50-80%。在AWS云服务上,使用CompactifAI压缩后的模型可大大节省费用,每处理百万tokens可以节省约30%费用。
更重要的是,CompactifAI让AI模型得以进入“平民设备”时代。Multiverse声称,其部分精简模型小到可以在PC、手机、汽车上运行,无需依赖昂贵的服务器。这一特性恰好契合了苹果等硬件巨头的战略需求。据透露,Multiverse已与苹果、三星、Sony、HP等洽谈合作,计划将超小模型嵌入下一代终端设备。
然而,赛道竞争也在加剧。自2024年起,科技巨头纷纷下场布局小模型,meta、Google DeepMind、微软等相继推出了一系列小模型产品。初创公司中,Neural Magic、Deci等也在争抢AI效率赛道,聚焦模型加速、自动选型等方向。面对如此激烈的竞争环境,Multiverse能否保持其领先地位,尚需观察。
尽管Multiverse的技术壁垒并不算太高,但其团队在量子计算和金融领域的深厚积累,为其在AI压缩领域提供了独特优势。Multiverse还积极与硬件厂商合作,试图在端侧模型上建立自己的生态壁垒。然而,如何在端侧模型布局上解决工程化问题,以及提升模型本身的技术壁垒,仍是Multiverse面临的挑战。
尽管如此,Multiverse Computing的“量子瘦身”技术仍被视为AI原生创新领域的一大亮点。其成功不仅在于技术的突破,更在于对行业痛点的敏锐捕捉和快速响应。随着AI技术的不断发展,Multiverse能否持续引领行业变革,值得期待。