近日,AI领域迎来一则重磅消息:开源推理框架vLLM的核心团队正式创立初创公司Inferact,并以8亿美元的投前估值完成1.5亿美元种子轮融资。本轮融资由Andreessen Horowitz(a16z)与Lightspeed Venture Partners联合领投,为这家新锐企业注入强劲资本动力。
此次融资不仅印证了市场对vLLM商业化路径的长期关注,更折射出AI行业战略重心的迁移——从侧重模型训练转向强化应用推理环节。据行业分析,推理环节的效率提升将直接决定AI技术的落地速度与成本结构,这成为资本竞相布局的关键因素。
Inferact的技术基因可追溯至加州大学伯克利分校Ion Stoica教授实验室。作为Databricks联合创始人,Ion Stoica团队研发的vLLM框架通过突破性显存管理技术,在保持模型精度的同时,将大模型运行速度提升数倍,并显著降低能耗。这种技术优势使其开源版本迅速获得行业认可,目前已被亚马逊云服务(AWS)及亚马逊电商等头部企业采用。
值得关注的是,Inferact并非伯克利实验室孵化的唯一明星项目。与其形成"双雄"格局的RadixArk同样源自该校,该团队基于SGLang框架开发的商业化产品,近期刚完成由Accel领投的4亿美元估值融资。两家企业接连获得顶级资本青睐,凸显投资者对高效AI部署技术的战略布局——通过优化推理环节,构建更具成本效益的AI基础设施。
据知情人士透露,Inferact计划将本轮融资用于技术研发与生态建设,重点拓展企业级客户市场。随着AI应用场景的指数级增长,推理环节的效率瓶颈日益凸显,这家拥有学术基因的初创企业能否突破技术天花板,将成为影响行业格局的重要变量。












