硅谷最新发布的AI行业研究报告引发广泛关注,这份由OpenRouter与a16z联合撰写的《AI发展现状:基于百万亿Token的实证研究》显示,开源模型与闭源模型正形成互补格局,中国开源力量成为全球增长的重要引擎。报告基于2024年11月至2025年11月期间OpenRouter平台300余个模型的使用数据,通过分析真实Token消耗量而非传统基准测试分数,揭示了AI发展的新趋势。
研究显示开源模型使用量持续攀升,预计年底将占据总用量的三分之一。中国开源模型表现尤为突出,其周使用量占比从去年底的1.2%跃升至最高30%,平均占比达13%,与全球其他地区开源模型的13.7%基本持平。值得关注的是,开源市场格局正从DeepSeek主导转向多元化竞争,下半年MiniMax M2、Kimi K2等新模型相继涌现,预计年底将形成5-7个模型均分市场的局面。
模型形态方面,中型参数模型(150亿-700亿参数)正取代小型模型成为市场新宠。报告指出,2024年11月前中型模型市场几乎空白,但随着Qwen2.5-Coder-32B等模型的发布,该细分领域迅速崛起。数据显示用户更倾向于选择性能强劲的中型模型或顶级大型模型,小型模型主导市场的时代已告终结。
语言模型的功能定位发生根本性转变,推理执行能力成为核心竞争力。年初推理相关Token用量微乎其微,现已占据总用量的50%以上。马斯克旗下xAI的Grok Code Fast 1在推理流量中占比领先,Gemini系列和DeepSeek R1紧随其后。工具调用功能同样呈现爆发式增长,从年初仅GPT-4o-mini等少数模型支持,到年中超半数模型具备该能力,Claude 4.5 Sonnet等新模型快速抢占市场份额。
编程和角色扮演成为AI两大核心应用场景。编程任务用量从年初的11%激增至50%以上,虽然Claude系列长期占据主导地位,但OpenAI市场份额已从2%提升至8%,谷歌保持15%份额,MiniMax等开源模型正在快速崛起。角色扮演领域表现同样亮眼,在开源模型中占比达52%,DeepSeek超过三分之二的流量来自该场景,显示出强大的用户粘性。
不同模型呈现差异化发展路径:Anthropic专注编程技术任务,80%以上流量来自该领域;谷歌模型应用场景最为广泛,覆盖法律、科学等多个领域;xAI近期在编程、角色扮演和学术用途方面增长显著;OpenAI则从娱乐休闲向技术任务转型;Qwen模型在编程领域持续发力,角色扮演和科学任务占比随时间波动。
用户留存呈现独特的"水晶鞋效应"——前沿模型发布时能精准锁定核心用户群体,这些用户的任务需求与模型新能力高度匹配,形成长期使用习惯。典型案例包括Claude 4 Sonnet和Gemini 2.5 Pro,其用户五个月后留存率仍保持40%。报告指出,率先突破关键能力的模型即使后续被超越,仍能凭借早期优势守住市场份额。
区域市场格局发生显著变化,亚洲地区付费使用量占比从13%翻倍至31%,北美市场虽仍居首位但份额降至不足50%。语言使用方面,英语占据82%主导地位,简体中文以近5%的份额位居第二。价格因素对使用量的影响远低于预期,模型降价10%仅带来0.5%-0.7%的使用量增长,反而可能因"杰文斯悖论"导致总支出不降反升。
研究同时指出数据局限性,OpenRouter平台主要反映开发者API调用行为,未涵盖ChatGPT等终端用户直接访问流量。平台定价策略也可能影响模型选择,例如GPT-5.1与Claude的价格差异会导致数据倾斜。尽管存在这些限制,该报告仍为理解AI发展提供了全新视角和重要参考,完整报告可通过指定链接获取。









