OpenRouter与a16z联合发布的深度报告,基于对全球100万亿Token的实证分析,勾勒出2025年人工智能领域的关键趋势。这项研究首次以真实算力消耗为基准,覆盖300余个模型、60余家提供方,揭示了AI技术从实验室走向产业化的深层变革。
开源模型正经历从"备选方案"到"场景首选"的质变。中国开源生态的崛起尤为显著,DeepSeek、Qwen、Kimi等模型在2025年下半年单周流量占比突破30%,较2024年末的1.2%实现指数级增长。这种突破源于高频迭代能力——Qwen 2.5 Coder 32B等中型模型通过持续优化,在编程、科学计算等场景展现出与闭源模型抗衡的实力。开源阵营内部呈现多元化格局,单模型流量占比稳定在25%以下,开发者可根据具体需求灵活选择工具。
推理优化模型成为流量增长引擎,其处理的Token占比从年初的个位数跃升至50%以上。用户需求从"生成文本"转向"解决问题",要求模型具备思维链(CoT)计算、任务规划等复杂能力。xAI的GrokCodeFast1与谷歌Gemini 2.5系列在此领域形成双雄争霸,前者在代码推理任务中占据最大份额,后者则凭借多模态能力领跑通用推理场景。工具调用指令的常态化使用,标志着AI开始深度嵌入企业工作流,而非孤立存在。
编程与角色扮演构成AI应用的两大支柱。编程类请求占比从年初的11%飙升至50%以上,Anthropic的Claude系列凭借60%的市场份额确立统治地位,但Qwen3Coder、MiniMax等新兴势力正在蚕食其领地。开源模型则在角色扮演领域展现绝对优势,占据该场景52%的流量,用户利用其无审查特性进行故事创作、游戏互动等创意活动。这种分化格局反映出AI应用的双重属性——既是生产力工具,也是创意引擎。
亚洲市场正改写全球AI版图。该地区付费使用量占比从13%翻倍至31%,中文以近5%的份额超越西班牙语、俄语成为第二大交互语言。这种增长不仅源于模型生产能力,更得益于庞大的企业应用场景。成本分析显示,价格弹性远低于预期——整体降价10%仅带来不足1%的流量增长,但在Gemini Flash等高效模型上,极致低价引发使用量报复性反弹,印证了"杰文斯悖论":技术效率提升反而刺激总消耗量上升。
用户留存呈现"水晶鞋效应":新模型若能在发布初期完美解决特定痛点,将形成高粘性用户群体,即使后续出现更廉价替代品也难以动摇其地位。GPT-4o Mini、Claude 4 Sonnet等模型因精准匹配需求,留存率曲线长期维持高位。反之,缺乏场景适配的模型则面临快速流失。这种动态重塑着市场竞争规则——模型厂商的护城河不在于技术参数,而在于对关键工作负载的解决能力。
中型模型(15B-70B)的崛起打破"大小模型"的二元对立。这类模型在能力与效率间取得平衡,成为市场新主流。Google Gemma等小模型虽不断涌现,但整体份额持续下降;而超过70B的大型模型则因部署成本高昂,逐渐退守高价值专业领域。这种结构变化反映出AI技术向实用化、精细化演进的趋势。











