AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资,公司估值跃升至17亿美元。这支由90后华人主导的团队,凭借独特的评估模式和开源技术积累,在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投,Andreessen Horowitz、The House Fund等知名机构跟投。
故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS,因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量,现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的,却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。
"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化,通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者,新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大,2024年Chatbot Arena正式独立为商业公司lmarena.ai,转型专注AI模型评估赛道。
当前主打的LMArena平台构建了三维评估体系:匿名对战机制下,用户提问后系统随机匹配两个模型匿名作答,投票后才揭晓身份;评分系统采用改进版Elo算法,通过胜负关系动态调整分数;人机协同框架则通过算法平衡模型曝光度,避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性,成为行业公认的"模型试金石"。
数据印证着平台的爆发式增长:自2024年获得1亿美元种子轮融资后,累计收集5000万张跨模态投票,完成400余种开放/专有模型评估,产出14.5万个开源战斗数据点。当前排行榜上,Gemini 3 Pro以1490分领跑,OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可,让这个由学术团队转型的创业公司,在AI评估赛道走出独特路径。










