欧洲新兴的人工智能企业Multiverse Computing近期震撼发布了两个超微型AI模型——“ChickBrain”与“SuperFly”。据公司透露,这两款模型在体积上达到了前所未有的小巧,却依然保持着强大的性能,足以在智能手机、平板电脑、个人电脑乃至物联网设备上实现离线运行。
让我们深入了解这两款新品的具体细节。SuperFly模型是基于Hugging Face的SmolLM2-135进行压缩的,其参数量从原始的1.35亿减少到了9400万,体积之小堪比苍蝇大脑。这使得它非常适合在低算力场景下应用,如家电设备,用户可以通过简单的语音指令与其互动,比如利用Arduino控制洗衣机的运行模式。
而ChickBrain模型则源自meta的Llama3.18B,经过压缩后,其参数量降至32亿。尽管体积有所缩减,但它却能在MacBook上流畅地本地运行,并且在MMLU-Pro、Math500、GSM8K、GPQA Diamond等多个基准测试中,表现略优于原版模型。
Multiverse Computing将这一系列模型亲切地称为“Model Zoo”,并以动物大脑的大小来命名它们。公司明确表示,他们的目标并非与那些顶级的大型AI模型一较高下,而是致力于在极小的体积内,保留高实用性的功能。
目前,Multiverse Computing已与苹果、三星、索尼、惠普等多家知名企业展开了合作洽谈,其中惠普更是其投资方之一。除了直接向硬件制造商供货外,公司还在AWS平台上提供了压缩模型的API接口,开发者能够以低于行业平均水平的费用调用这些模型。Multiverse的压缩技术还被广泛应用于图像识别等领域,其客户涵盖了巴斯夫、Ally、穆迪、博世等多家行业巨头。