滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

AI模型评估赛道崛起：90后团队打造LMArena 获1.5亿美元融资估值17亿

时间：2026-01-07 23:46:47 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

AI大模型评估领域迎来一匹黑马——LMArena正式宣布完成1.5亿美元A轮融资，公司估值跃升至17亿美元。这支由90后华人主导的团队，凭借独特的评估模式和开源技术积累，在资本市场掀起热潮。本轮融资由Felicis与加州大学投资公司UC Investments联合领投，Andreessen Horowitz、The House Fund等知名机构跟投。

故事要从2023年ChatGPT引发的AI革命说起。当时由UC伯克利、斯坦福等顶尖高校学者组成的开源组织LMSYS，因开发出革命性的推理引擎SGLang崭露头角。该引擎首次实现96块H100显卡集群达到接近DeepSeek官方报告的吞吐量，现已被xAI、英伟达、阿里云等全球数十家科技企业采用。但真正让团队出圈的，却是他们为验证自研模型Vicuna性能而打造的第三方评估平台——Chatbot Arena。

"传统基准测试无法区分模型的真实水平。"LMSYS核心成员郑怜悯回忆道。他们开创性地将模型匿名化，通过用户实际交互投票决定优劣。这种双盲测试模式迅速吸引全球AI开发者，新模型发布前都会偷偷在这个平台"打榜"。随着影响力扩大，2024年Chatbot Arena正式独立为商业公司lmarena.ai，转型专注AI模型评估赛道。

当前主打的LMArena平台构建了三维评估体系：匿名对战机制下，用户提问后系统随机匹配两个模型匿名作答，投票后才揭晓身份；评分系统采用改进版Elo算法，通过胜负关系动态调整分数；人机协同框架则通过算法平衡模型曝光度，避免"刷榜"行为。这种设计使评估结果兼具实时性与客观性，成为行业公认的"模型试金石"。

数据印证着平台的爆发式增长：自2024年获得1亿美元种子轮融资后，累计收集5000万张跨模态投票，完成400余种开放/专有模型评估，产出14.5万个开源战斗数据点。当前排行榜上，Gemini 3 Pro以1490分领跑，OpenAI、Anthropic等头部企业的模型均在此接受检验。资本的青睐与行业的认可，让这个由学术团队转型的创业公司，在AI评估赛道走出独特路径。

更多>同类资讯

品牌乱价“顽疾”怎么破？从监测到溯源，三步搭建控价“防火墙”

做品牌的朋友都懂一个痛：明明定了统一指导价，打开电商平台一看，价格已经"穿底"了。跨平台、跨区域的窜货链条越拉越长，品牌方想从一条链接追溯到具体经销商，常常要耗费大量时间和精力，取证难度直线上升。控价不是简…

07-07

豆包千问下线UGC智能体，AI行业告别野蛮生长转向高质量发展

07-07

QCY Melobuds N65耳机上架：8麦克风降噪+50小时续航仅售259元

07-07

具身智能浪潮涌动，上海智元世界模型夺冠引领产业新飞跃

07-06

智元机器人家族集结！覆盖七大场景引领通用具身智能新潮流

07-06

自变量 4 轮融资，交割速度领跑具身行业

07-06

TikTok全球多地裁员，印尼电商业务大幅收缩

07-06

重回研发前线！小米罕见跨部门调动，葛维严出任手机相机部第四任掌门

07-06

REDMI年内第二轮涨价：K90上调200元，Note 15全系上涨300元

07-06

伪装未成年、批量投毒：Meta被曝系统性试探ChatGPT、Gemini安全底线

07-06

原抖音直播负责人钱景离职：架构调整后权力交接，金黄龙全面接棒

07-06

中央网信办推进AI应用整治：处置违规账号2.6万，多地多平台协同发力护清朗网络

07-06

抖音直播人事变动：原负责人钱景离职，曾主导搭建产品技术架构

07-06

AI助播新势力崛起：深度测评揭秘助播虾如何领跑直播中控赛道

行业特殊需求：童装、母婴类商家可重点关注具备虚拟IP伴播功能的助播虾，以增强趣味性；女装、美妆类商家需要频繁换款和细节讲解，强大的智能导播和语音切品功能是关键；本地生活商家则需确保软件完美支持抖音团购的核销与…

07-06

沃尔玛广告业务加速崛起：多笔收购助力，增长势头直追亚马逊

（此处两家企业均将广告收入与线上商品销售额对比，因为线上电商是二者广告业务的核心流量来源。亚马逊广告业务已发展二十余年，全年广告收入 680 亿美元，收入主要来自平台第三方商家购买站内推广位宣传商品；近期亚马…

07-06

点击查看更多 +

全站最新

AI助播新势力崛起：深度测评揭秘助播虾如何领跑直播中控赛道

沃尔玛广告业务加速崛起：多笔收购助力，增长势头直追亚马逊

曾毓群“泼冷水”：固态电池商业化尚远，当下选车别被概念“忽悠”

极氪猎装车：以独特魅力，与年轻车主共赴时尚运动之约

武汉能科技AIGC影像智造工坊：一键开启全品类AI创作新体验

豆包千问7月15日关停智能体功能行业合规整改迈出全面规范化关键一步

热门内容

本栏最新

AI助播新势力崛起：深度测评揭秘助播虾如何领跑直播中控赛道

沃尔玛广告业务加速崛起：多笔收购助力，增长势头直追亚马逊

豆包千问7月15日关停智能体功能行业合规整改迈出全面规范化关键一步

京东汽车携手壳牌深化合作首发新品并共建主题门店共拓汽车养护新体验

菜鸟国内供应链整合入淘天集团海外布局持续发力形成内外分治新格局

字节登记网络热门表情包著作权，互联网meme共创生态或受冲击？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.