近期,AI领域出现了一个引人注目的现象:海外开发者群体中掀起了一股注册中国支付工具的热潮,其目的竟是为了以更优惠的价格订阅中国AI企业推出的Coding服务套餐。这一现象的背后,是中国AI模型厂商智谱的定价策略引发的连锁反应。
智谱的GLMCodingPlan是国内较早推出的AI编码订阅服务之一,其国内版分为Lite、Pro、Max三档,2026年调价后月费分别为49元、149元、469元。然而,海外用户打开智谱官网订阅页面时,看到的却是另一番景象:单月计费模式下,Lite为18美元/月、Pro72美元/月、Max160美元/月,即便按季度折算,价格也远高于国内版,相当于国内版的2-3倍。这种明显的价格差异,让海外用户直呼遭遇了“护照税”。
事实上,智谱的海外版定价并非一成不变。最初,其海外版定价为6美元/30美元/80美元,但在今年历经多次涨价后,价格一路飙升。而在早期促销阶段,加上季度订阅的折扣,每月最低能做到3美元,一度被海外媒体称为“3美元版ClaudeCode”。然而,涨价后不同价格对应的配额并未显著增加,每档提供约80/400/1600次prompt配额/每5小时,与国内档位价格一致。这意味着海外用户不仅要支付更高的费用,享受的服务却并无明显提升。
涨价的不只是海外版,国区也未能幸免。今年2月,GLM Coding国区Lite/Pro/Max价格从40/200/400元上涨到49/149/469元,并且配额相应减少三分之一。智谱在价格调整函中表示,涨价源于市场需求持续强劲增长,用户规模与调用量快速提升,公司同步加大算力与模型优化投入以保障高负载下的服务稳定性。此次调整后,周度上限将按照“5小时额度的4倍”重新计算,即如果某档套餐每5小时可用80次请求,那么新的周度总额度大致就是320次。
海外用户为了避开这一“赛博税”,可谓绞尽脑汁。几周前,博客作者Levi分享了自己的经历:当他准备开通GLM CodingPlan时,发现已售罄,定闹钟抢购也秒没。不过,他随后发现通过一些支付渠道优惠,订购海外版Max包年套餐可以接近国内渠道价格,最终开通了Pro版的包年套餐。但Levi实测发现,GLM官方此前宣传的Pro套餐额度大约是ClaudePro的3倍以上,实际使用中却有点“虚标”,用GLM5.1模型跑完一个复杂任务就用完了8%的配额,半天使用量就达到10%,高强度使用的话,Pro套餐明显不够。他还发现,GLM CodingPlan+GLM5.1的额度消耗是ClaudeCode+Opus4.6的1.5-2倍,和Codex+GPT5.4-high基本持平。
从商业逻辑来看,区域差价是全球SaaS行业的常见策略。各地支付能力不同,欧美开发者每月为生产力工具支付10至30美元并不陌生;海外版可能要走国际节点、使用海外算力资源和支付渠道,成本更高;企业策略也有差异,国区面向海量工程师市场,先做规模再变现,海外区主攻欧美、印度等高ARPU市场,追求单用户收入。因此,“同模型不同护照价格”本质上是一种差异化运营。
2026年,几乎所有主要的大模型公司和云厂商都推出了自己的CodingPlan或类似产品。大部分模型厂商面向国内的价格普遍在40-50元/月之间,只有Minimax采取了相对低价的策略,月费29元,只支持自家M2系列模型,主打性价比。这一策略让MiniMax在Token调用量暴涨的2026年一季度迎来爆发,3月中旬其主力模型MiniMaxM2.5周调用量达到1.75万亿tokens,连续五周位列全球第一。同一时期,月之暗面的KimiK2.5为5600亿tokens,智谱GLM系列则稳定进入全球前五。到了4月编程场景榜单中,MiniMax M2.7再以124B tokens登顶,GLM-5.1与KimiK2.5分列第五、第七。
不过,低价策略的可持续性也受到质疑。Anthropic近期调整了产品策略,不再允许用Claude订阅运行OpenClaw。小米集团MiMo负责人罗福莉在X平台发文称,建议所有LLM公司在搞清楚“codingplan怎么定价不亏钱”之前,不要盲目打价格战。值得注意的是,多家厂商已经不再采取Token积分,而是配额Prompt的机制,几乎所有计划都使用了“5小时滚动刷新+周/月上限”的配额模式,以避免少数人占用大量资源,同时鼓励用户定期使用。不同模型对配额的消耗系数不同,智谱的GLM5系列模型在峰时要消耗3倍配额,非峰时2倍,鼓励用户在非高峰时段调用先进模型;MiniMax和Kimi则用缓存机制抵消配额消耗,缓存命中时只计费0.7元/百万tokens。
从行业层面看,中国模型公司通过低价高配额的CodingPlan争夺全球开发者的时期已经告一段落。全面涨价背后,是国产模型在商业化市场上与头部模型公司正面竞争,这既有Agent生态引发的用户侧供需关系变化,也打破了算力市场的供需平衡。罗福莉在X上写道,全球的算力供给跟不上agent带来的token需求增长,真正的出路是模型和Agent的“协同进化”。知名半导体分析机构Semi Analysis发布的报告显示,美国市场上,英伟达H100一年期GPU租赁合同的价格已从2025年10月的低点1.70美元/小时/GPU飙升至今年3月的2.35美元/小时/GPU,涨幅近40%。而国产算力正在加速接入国产模型体系,摩尔线程方面曾表示,其MTTS5000服务器已实现“Day-0”兼容性,可为GLM-5.1提供服务。
智谱的财报电话会议上,CEO张鹏披露,2026年一季度接口调用价格提升了83%,但调用量仍然增长400%。几个月前,海外媒体对GLM等国产模型在Coding等生产力场景中的印象还是“价格只有CursorUltra的1/66”,如今接连涨价的智谱也在用户社区中引发了争议。有海外用户发帖吐槽“三个月涨了五倍,简直贵得离谱”,但也有用户表示,价格调整后,随着模型调用量回归到正常值,GLM系列模型调用的平顺性大幅提升。截至4月14日收盘,智谱在港股的最新市值已经来到了4200亿港元,市值超过同期上市的MiniMax1300亿港元。随着国产模型在能力输出、稳定性、安全性和生态支持上逼近头部模型,以及全球模型调用供需关系的变化,国产模型的低价时代正在迎来终结。










