在科技浪潮的推动下,AI行业近两年经历了从狂热到理性的显著转变。曾经,企业竞相追逐AI的接入,将其视为通向未来的钥匙;而今,随着AI在企业运营中的深度渗透,如何平衡成本与收益,成为摆在众多企业面前的新课题。
回溯至2024年,企业间最常探讨的话题是“是否已接入AI”,而到了2025年,这一话题逐渐演变为“AI的使用量如何”。然而,进入2026年,随着AI应用成本的日益凸显,企业开始更加审慎地考虑:“AI的投入还能持续多久?”这一转变,标志着AI行业正步入一个全新的发展阶段。
AI大模型的部署与应用,离不开持续的Token消耗,这类似于手机流量套餐的计费方式。对于众多中小企业而言,高昂的Token费用成为了制约其发展的瓶颈。硅谷及国内科技圈近期出现的一系列现象,如大型企业限制高成本模型调用次数、预算超支后切换至低价模型、重新审视AI全栈计划等,均反映了企业在AI投入上的谨慎态度。
以Uber为例,其在扩大AI编程工具覆盖范围后,一度面临AI预算支出远超预期的困境。开发者社区的统计数据进一步揭示,在复杂Agent任务中,无效循环、重复调用及调试过程中的资源浪费,占据了Token消耗的相当比例。这些现象表明,AI的广泛应用并未直接带来利润的提升,反而让企业陷入了成本控制的难题。
传统软件与AI在成本结构上存在显著差异。前者更像是一次性投入的买断制图书馆,增加用户的成本有限;而后者则如同出租车,每行驶一公里都需付费。这种边际成本始终存在的特性,使得AI从诞生之初就面临着与传统互联网不同的挑战。
随着AI在企业各环节的广泛应用,从客服到程序员,从市场部门到法务、财务部门,AI的使用率不断攀升。然而,企业很快发现,AI带来的效率提升并不等同于利润增长。一些企业最初抱着互联网时代的惯性思维,认为用户越多、调用越多、覆盖率越高越好,甚至将Token消耗量列入KPI,导致大量算力被低价值需求消耗。
经济学中的古德哈特定律在此得到了印证:当一个指标成为目标时,它就不再是一个好指标。Token消费量也不例外。企业逐渐意识到,重度使用AI的团队未必创造最高价值,而一些调用量不高的团队却可能通过业务流程重构实现显著效益。
面对这一现实,企业开始从“Token极大化”转向“ROI极大化”,重新计算每投入1元AI成本能换回多少收入,每消耗100万个Token能节省多少人工,每部署一个Agent能减少多少流程摩擦。这些问题虽然不如参数规模吸引眼球,却更贴近商业世界的本质。
AI行业的发展轨迹与十五年前的云计算普及有着惊人的相似之处。当时,企业纷纷将业务搬到云端,却很快发现云账单令人头疼,资源浪费、服务器空转等问题层出不穷。随后,FinOps(云成本管理)应运而生,企业开始研究如何优化云资源使用效率。如今,AI行业正经历着同样的过程,企业开始建设模型路由系统,根据任务复杂度灵活配置模型,以实现投入产出比的最大化。
麦肯锡的研究指出,大量AI试点项目未能实现规模化落地,原因往往并非模型能力不足,而是缺乏明确的评估机制、治理体系及组织协同能力。许多企业拥有先进的模型和海量数据,却因组织结构不匹配而无法充分发挥AI的潜力。因此,AI转型本质上不是软件升级,而是组织升级。
在这场变革中,三类企业可能面临被淘汰的风险:一是将AI当作展示项目却找不到实际应用场景的企业;二是缺乏成本控制能力、无法建立有效资源管理体系的企业;三是组织结构未同步进化、决策流程和工作方式仍停留在旧时代的企业。相反,那些拥有明确业务场景、能够灵活配置模型、建立数据模型业务闭环并持续衡量AI真实价值的企业,将更有可能在竞争中脱颖而出。
对于投资者而言,这一变化同样值得关注。过去,市场热衷于讨论参数规模、模型排名和Token增长速度等指标;而未来,资本市场可能更加关注单位算力创造的收入、单位Token产生的利润以及AI投入能否形成稳定现金流等更具实际意义的指标。因为任何技术革命最终都要回答同一个问题:它究竟创造了多少真实价值。











