互联网大厂工程师林鸣曾是Cursor的忠实用户。一年多前,他主要用这款AI编程工具补几行代码或调整参数,大模型直接嵌入编辑器,调用起来十分便捷。如今,他的工具箱已换成Claude Code、Codex和公司自研的AI编程工具。这种转变不仅体现在工具选择上,更反映出AI编程领域的技术演进——从辅助编写到接管整个研发流程。
过去,AI更像程序员的副驾驶,人类仍掌握主导权;现在,模型直接嵌入研发链条,能自主拆解需求、阅读代码、调用工具、运行测试并交付成果。林鸣发现,自己可以将整块任务交给AI处理,但随之而来的是token消耗量的激增。公司最初为工程师提供几乎不限量的使用额度,后来因成本压力收紧,许多工程师选择自费订阅工具,这一现象折射出AI编程市场的真实需求。
AI编程工具的商业化路径正在分化。Anthropic凭借Claude Code率先打开市场,其用户量虽不及OpenAI,但估值已逼近万亿美元,关键在于开发者付费意愿和企业采购需求的双重驱动。OpenAI迅速调整策略,将Codex置于更重要位置,其周活跃用户半年增长逾7倍,突破500万大关。国内智谱则走性价比路线,其GLM5.2模型软件工程能力接近Claude Opus 4.8,定价仅为后者的七分之一,这种策略使其市值一度突破万亿港元,尽管公司仍处于亏损状态。
字节跳动也加入了这场竞争。其最新发布的豆包2.1 Pro强化了Coding和Agent能力,在现场演示中直接对标Claude Opus等头部模型。火山引擎总裁谭待表示,公司不再单纯追求用户规模,而是将重心转向开发者、Agent和真实工作流。这一转变背后是双重考量:企业市场已展现付费能力,而持续攀升的算力成本迫使公司寻找可持续的商业模式。
AI编程的商业价值体现在两个层面。开发者端,主流工具从每月几美元的插件升级为订阅加用量模式,个人版月费十几至几十美元,高强度Agent版本可达100美元以上。企业端则按席位、token或合同付费,工具一旦进入研发流程,就能形成可预测的现金流。Anthropic的收入曲线最具说服力:Claude Code发布不到一年,年化收入已达25亿美元,其中超半数来自企业客户,年支出百万美元以上的大客户数量在两个月内翻倍。
成本压力同样显著。以豆包为例,其日活用户超2亿,但日收入不足百万元,主要来自电商佣金。然而,今年5月单日算力成本达数千万元,多模态功能的成本是纯文本交互的数倍甚至数十倍。企业内部的token使用也面临类似问题:林鸣所在的公司最初提供不限量额度,发现收益未成倍增长后转为成本控制。字节技术副总裁洪定坤指出,尽管TRAE团队90%的代码由AI生成,但人均需求吞吐率仅提升60%,问题出在代码生成后的环节——UI、可靠性和可维护性等关键指标得分仅40至60分。
字节的AI战略覆盖多条业务线,包括世界模型、视频模型、Coding与Agent以及豆包商业化。在AI编程领域,其布局覆盖三个层级:前端用TRAE和插件抢占开发者入口,中间层以CLI和企业版切入研发流程,底层由火山方舟和豆包模型提供算力支持。豆包2.1 Pro的发布明确了重心转向Coding和Agent,官方称其在多项测试中接近GPT-5.5和Claude Opus 4.7的水平。
字节的优势在于企业服务经验和低价策略。火山引擎拥有完整的云服务链条,飞书沉淀了大量企业客户,Seedance已跑通“模型能力变现”模式,年化收入约143亿元,毛利率约70%。豆包Coding Plan的定价极具竞争力:首月仅需9.9元,Lite套餐后续40元/月,Pro套餐200元/月,远低于海外主流工具20美元起的月费。API侧,Doubao-Seed-Code按上下文长度分层计费,配合缓存后综合使用成本比行业平均低62.7%,且支持Claude Code、Cursor等主流开发环境,降低开发者迁移成本。
但B端市场与C端截然不同。开发者可能因低价尝试新工具,但长期留存取决于产品能否稳定处理复杂任务、出现问题时能否及时响应。谷歌的案例具有参考价值:尽管拥有Google Cloud、Android等强大生态,且推出Gemini Code Assist等工具,定价也不算高,但至今未能占据开发者心智。这表明,在AI编程领域,生态和价格只是入场券,真正决定成败的是产品体验、模型能力和开发者信任。
开发者对工具的选择极为务实。林鸣将模型分为三个梯队:Claude和ChatGPT居第一梯队,负责最难任务;智谱、Kimi、DeepSeek属第二梯队;其余归为第三梯队。他九成的模型支出花在第一梯队,剩余大多投向DeepSeek,理由很简单——用最强工具处理最难任务,用性价比工具完成日常工作。这种“谁好用就用谁”的态度在开发者中普遍存在,各家争来的用户可能因别家更好用、更便宜或更稳定而流失。
模型间的差距正在缩小。林鸣感受到,虽然模型仍在进步,但速度已不如从前,各模型能力差异也在减小。a16z创始人Marc Andreessen指出,GLM-5.2可能是首个在多数任务上匹敌甚至超越美国头部模型的中国模型,这标志着大模型能力格局从少数美国实验室主导走向多极化。当能力差距缩小,定价策略成为关键,算不好账可能伤及自身——智谱曾因Coding Plan销售太好而限量发售,高峰期按更高倍率扣减额度。
新玩家不断涌入加剧了竞争。6月下旬,DeepSeek高调扩招,筹建对标Claude Code的团队;Kimi将企业业务置于更重要位置。赛道逐渐分化为两条路线:一条是Anthropic和OpenAI代表的高端路线,以模型能力、产品心智和企业信任为底牌,销售“AI员工”;另一条是DeepSeek、智谱等走的低价开放路线,争夺API调用、工具集成和私有化部署份额。字节恰好处于中间地带——既想打造能嵌入企业工作流的Agent系统,又选择低价兼容策略切入市场,这种打法可能带来双重优势,也可能面临双重挑战。








