全球AI算力市场正经历前所未有的供需失衡,从GPU硬件到数据中心基础设施全链条价格飙升,而供给端却难以跟上需求的爆发式增长。研究机构SemiAnalysis最新数据显示,H100 GPU的一年期租赁价格在五个月内从每小时1.70美元跃升至2.35美元,涨幅达38%,且所有型号的按需算力资源均已售罄。这种紧张局面不仅反映在租赁市场,更引发了服务器产业链的连锁反应。
需求端的结构性变革成为此轮短缺的核心推手。Anthropic等AI企业的商业化进程显著加速,其季度经常性收入从90亿美元暴增至250亿美元,直接带动推理算力需求呈指数级上升。开源模型生态的繁荣进一步放大了这种效应——GLM、Kimi K2.5等模型的广泛部署,使得多智能体协作场景下的算力消耗出现抛物线式增长。与此同时,AI代理技术的突破催生了新的工作负载模式,这类任务需要持续迭代的高并发计算,对算力资源形成持续压力。
媒体生成领域的创新同样加剧了资源争夺。Seedance和Nano Banana等原生平台推动的图像视频生成需求,正在消耗海量GPU资源。SemiAnalysis分析指出,当AI工具的投资回报率维持在5-10倍区间时,需求对价格变动的敏感度极低,这意味着租赁价格仍有较大上行空间才会抑制需求增长。这种价格不弹性特征,使得需求曲线持续向右上方移动。
供给端的瓶颈则呈现多维度特征。内存市场成为首个爆发点,2026年初DRAM和NAND价格出现非理性上涨,LPDDR5和DDR5合同价同比涨幅分别接近400%和500%。这种成本激增迅速传导至服务器整机环节,OEM厂商的报价涨幅远超元器件成本上升幅度,导致运营商项目回报率压缩,部分新部署计划被迫延期。Blackwell新一代GPU的交付周期已延长至6-7个月,开源权重模型的旺盛需求与推理算力短缺形成双重挤压。
市场权力格局在六个月内发生根本性逆转。曾经激烈竞争的Neocloud运营商如今掌握绝对议价权,他们通过提高预付款比例、延长合约期限、灵活安排交付时间等手段重构交易规则。租赁市场形成清晰的层级结构:短期现货容量早已枯竭,中期合约(3个月至3年)成为价格风向标,而4-5年期的长期协议则被大型AI实验室垄断,单笔交易规模可达50-100兆瓦,相当于数万块高端GPU的算力储备。
这种结构性变化催生了独特的定价螺旋。供给收缩推高价格,促使运营商加速锁定硬件资源,进而加剧市场紧张程度。SemiAnalysis对比2023-2024年周期后认为,当前服务器市场成熟度更高,OEM超额利润空间受限,但租价上涨仍能显著改善运营商财务指标——既提升已部署资本的利润率,又延长现有GPU的经济寿命周期。
资本市场反应却与基本面形成鲜明反差。CoreWeave、Nebius等Neocloud上市公司股价持续低迷,仍处于过去12个月的交易区间底部。SemiAnalysis指出,市场仍被"长期供给过剩"的预期主导,未能充分消化当前持续稀缺的现实。具备短期合约占比高、H100存量规模大、新增产能即将上线等特征的运营商,将成为本轮周期的最大受益者。
判断价格走势的三大关键指标已浮出水面:GB300集群的投放节奏将决定短期供需平衡,硅片及存储器的供应紧张程度影响中游产能,而AI实验室的收入增长轨迹则从根本上塑造需求曲线。SemiAnalysis强调,在上述指标出现实质性转变前,算力价格上行趋势难以逆转。这种由技术革命引发的资源重构,正在重塑整个云计算产业的竞争格局。











