一张反映大语言模型(LLM)Token支出趋势的指数图,近期在金融与科技领域引发广泛讨论。该指数由Silicon Data统计,通过衡量全市场每百万Token的平均支付成本,成为观察AI技术商业化进程的重要指标。数据显示,6月11日该指数已连续七日下跌,创下今年1月以来最长连跌纪录,过去十二个交易日中仅有一天上涨。
这一波动并非孤立现象。自去年12月以来,该指数曾翻倍攀升,却在近期出现急转直下的态势。市场对此解读分化:部分观点认为这预示着AI需求见顶,另一些分析则指出这可能反映用户正从高价模型向低成本方案迁移。美国宏观策略师Andreas Steno Larsen将其称为"当前最需关注的图表",警告若趋势持续,可能动摇从内存到数据中心的整体投资逻辑。
指数构成机制揭示了其复杂性。该指标并非直接反映总需求或总支出,而是通过加权平均价格体现用户模型选择偏好。以具体案例说明:若某月全部流量使用10美元/百万Token的高端模型,指数为10;次月需求翻倍但新增流量全采用1美元/百万Token的廉价模型,指数将骤降至5.5。这种计算方式意味着,指数下跌可能对应两种截然不同的市场状态——需求萎缩或用量结构下沉。
华尔街机构对此展开激烈辩论。Citadel证券在《Tokenomics》报告中提出,AI落地的主要约束已从模型能力转向成本与资源稀缺性。报告强调,算力、电力、内存带宽等物理限制正在重塑产业格局,未来回报将更多来自效率提升而非单纯追求模型性能。该机构预测,推理密集型前沿AI将集中于少数大型企业,而广泛经济体可能转向更简单的模型解决方案。
价格竞争态势支持这种判断。DeepSeek将定价下调75%,小米MiMo推出接近99%的降价幅度,基础设施瓶颈缓解正触发行业价格战。Coinbase首席执行官Brian Armstrong预测,未来12至18个月内,80%的AI工作负载将迁移至成本降低99%的模型,仅20%的高难度任务继续使用前沿方案。斯坦福大学数据显示,本地模型在真实查询中的准确率已达71.3%,且运营成本极低。
企业端的实践提供现实注脚。某企业客户因未设置Claude使用上限,单月支出高达5亿美元;亚马逊开发者平台曾出现员工为刷排名让AI执行无意义任务的现象。这些案例促使企业转向"有效Token"管理,亚马逊改用追踪代码实际价值的考核指标,meta也调整了内部评估体系。Cloudflare推出的AI Gateway等产品,以及GitHub Copilot转向按Token计费的模式,都反映市场正在建立新的成本管控机制。
多空分歧在硬件投资领域尤为突出。高盛测算显示,代理式AI可能推动2030年Token消耗量增长24倍,云服务商毛利率有望短期转正。但反对声音指出,当前产业链繁荣过度依赖半导体企业,AI大厂普遍亏损的现状难以持续。随着按量计费模式普及,企业将更注重实际投资回报率,这可能逆转支撑GPU采购的资本流动。








