杭州的九月,空气中弥漫着科技竞争的火药味。阿里与字节跳动在“AI云市场”的排位争夺战,将这座城市推向了行业瞩目的中心。阿里云年度活动“云栖大会”期间,杭州萧山机场、杭州东站等交通枢纽的广告牌上,火山引擎的大幅广告格外醒目,其“占中国公有云大模型市场份额46.4%”的表述引发了广泛讨论。
火山引擎的广告策略颇为微妙。尽管未使用“最”“第一”等绝对化表述,但国内主流云厂商约十家,其独占近半份额的暗示,无疑传递了强烈的竞争信号。这种表述方式引发了行业质疑:有云行业人士指出,火山引擎的数据基于MaaS形态统计,主要覆盖闭源模型,而通过IaaS和PaaS部署开源社区下载模型的调用量未被纳入,单一维度的统计难以全面反映市场格局。
事实上,当前AI云市场的“第一”之争已陷入混乱。阿里、字节、百度等厂商在不同报告和广告中均宣称“领先”,但统计口径差异显著。例如,字节火山引擎强调大模型公有云市场调用量(MaaS)第一,涵盖其平台上所有第三方模型及豆包模型(不含内部业务调用)的Token总量;阿里云则以全链路服务营收为标准,覆盖从基础设施(GPU)到PaaS再到MaaS的完整体系;百度则聚焦“AI公有云服务市场”,包含产品定制和行业解决方案收入,甚至细化到“2025上半年大模型中标项目数量和金额双第一”。
这种分歧源于云计算市场的成熟与多元。中小企业可能按月租用虚拟服务器,个人开发者则按需调用API,而大企业需求更复杂。以火山引擎为例,其“大模型调用量”逻辑类似于外卖连锁店——客户无需关心后厨(模型、芯片、框架),只需关注结果(推理速度和质量)。这种流量导向的策略在互联网AI应用和中小开发者中颇具吸引力,例如其强调的20-40ms吐字间隔和500万初始并发TPM(每分钟处理Token数),在中度场景(如文档总结)下可服务1万用户。
相比之下,阿里和百度更倾向全栈解决方案。阿里云统计范围涵盖IaaS、PaaS到MaaS的完整体系,类似于功能齐全的厨房,提供从算力到模型服务的全链条能力。这种选择背后是长期壁垒的考量:一位大模型推理服务工程师比喻,全栈服务如同超市,客户购买API(杯子)时,若超市已提供完整产品组合(数据库、虚拟机),迁移成本将显著提高。数据绑定和整体解决方案才是云服务的核心粘性。
当前AI云市场的规模仍有限。2024年5月,火山引擎通过降价引爆价格战,将豆包旗舰模型Pro-32k降至0.0008元/千Tokens,带动调用量从1200亿Tokens暴涨至超5000亿Tokens。但据2025年上半年IDC统计,全国大模型调用量仅536.7万亿Tokens,按定价粗略计算,全年MaaS市场总盘子约5-6亿元,远不及阿里云2024年超800亿元的营收。这种差距反映了市场仍处于早期阶段,各厂商策略分化明显。
阿里云依托传统云服务优势,倾向于通过全栈方案扩大模型服务吸引力;火山引擎作为新入局者,则聚焦GPU和MaaS的未来增长。其CEO谭待曾表示,市场空间未来可能扩大100倍——豆包大模型日均Tokens使用量已超16.4万亿,较发布时增长137倍。但阿里云在云栖大会上回应称,仅看公有云调用量如同“只见冰山一角”,大量企业通过私有云或本地服务器部署开源模型,这部分调用量未被统计。
竞争维度正从单一指标转向效能与服务深度。2024年价格战尚能刺激市场,但2025年Token已足够便宜,企业更关注模型效果。例如,沙利文2025年上半年报告显示,按自研模型日均调用Token份额,阿里通义占17.7%,字节豆包占14.1%,DeepSeek占10.3%。这一数据体现了自研能力的竞争趋势。
差异化成为小厂商的生存之道。2025年,月之暗面推出的K2模型针对代码任务深度优化,性价比突出,调用量迅速攀升;智谱则推出GLM Coding套餐,提升编程服务并发数。这些案例表明,当无法复制大厂全栈路线时,聚焦细分场景、重新定义竞争指标成为关键。商业竞争的本质始终是客户选择——谁能真正满足需求,谁就能在市场中占据一席之地。