过去两年间,AI领域出现了一个看似矛盾的现象:Token生产成本持续走低,市场售价却不断攀升。这一反常现象背后,折射出Token商业模式正走向成熟,形成了一套独特的商业逻辑。硬件迭代与模型优化推动推理成本下降,而智能体应用爆发与业务闭环形成,则催生出对Token的旺盛需求。无问芯穹联合创始人兼CEO夏立雪指出,真正通过AI盈利的企业不会因价格波动退缩,反而会通过技术手段持续降低成本。
这家成立于2023年的科技公司,凭借独特的商业模式在行业中崭露头角。不研发通用大模型,不涉足芯片制造,也不直接开发消费端应用,无问芯穹选择在芯片与模型之间开辟新赛道。通过构建Agentic Infra体系,公司实现了算力资源的智能调度与优化匹配,将分散的算力转化为高效Token产出。这种介于产业链中游的定位,使其成为连接上下游的关键枢纽,芯片厂商、模型开发者与应用服务商均需接入其平台获取服务。
位于上海AI创新核心区的模速空间,以无问芯穹为圆心形成了完整的产业生态圈。公司披露的数据显示,2025年12月至2026年4月期间,其Agentic MaaS平台Token调用量增长超20倍,这一爆发式增长标志着推理市场正式超越训练市场。国际数据机构统计表明,2026年全球企业在推理基础设施的投入将达到680亿美元,较训练支出高出230亿美元。智能体场景的复杂任务需求,使得单个任务的Token消耗量达到简单对话的数十倍甚至上百倍。
产业价值重心随着推理需求爆发发生转移,芯片制造商、模型公司与云服务商纷纷调整定价策略。作为基础设施服务商的无问芯穹,正从传统"管道"角色向"Token工厂"转型,其商业影响力在价值链中持续攀升。公司内部采用双重指标衡量运营效率:单位时间Token产出量与系统稳定性。在万亿参数模型场景下,通过软硬协同优化,其服务性价比较两年前提升5至10倍。
无问芯穹提出的AI生产力公式:智能规模×Token生产效率×Token价值转化,揭示了商业闭环的核心逻辑。当Token业务形成可持续的盈利模式后,优质Token的稳定供应将吸引更多用户,而海量真实需求又反哺技术优化空间。这种双向促进机制使得公司能够接触更多应用场景,精准评估不同优化技术的实际价值。随着需求种类与资源匹配复杂度的提升,M种模型与N种芯片的组合优化空间呈指数级增长。
国产芯片在推理时代迎来战略机遇期,其成本优势与工程化能力正在重塑全球竞争格局。面对芯片种类激增、模型规模扩大与任务需求多样化的挑战,算力优化已演变为复杂的系统工程。大模型推理分为prefill与decode两个阶段,前者负责上下文构建属于计算密集型任务,后者负责输出生成属于通信密集型任务,这种特性差异为国产芯片提供了差异化竞争切入点。无问芯穹通过P/D分离技术,将不同任务分配至适配芯片,使国产算力在prefill场景实现有效落地。
Token正逐步成为AI产业的通用等价物,其生产、消耗、定价与交易机制日益完善。夏立雪将当前发展阶段类比为移动互联网从3G向4G的过渡期,但强调真正改变产业格局的将是新型组织形态。他预测,未来将涌现大量十人至二十人的AI原生组织,这些团队通过人机协作模式,其生产效率将远超传统同规模企业。代码生成与线上营销等领域已率先出现AI协作雏形,不同智能体分别承担开发、测试与运维等职能。
在商业模式创新方面,无问芯穹采用类似广告行业的CPM计费方式,按照Token使用量结算服务费用。这种定价机制促使行业关注AI实际价值产出,而非单纯资源消耗。技术优化带来的成本节约直接转化为企业毛利,形成研发投入的良性循环。面对推理需求分化趋势,国产芯片在prefill场景已展现性能优势,而decode阶段对卡间通信与软硬件生态的严苛要求,仍需持续技术突破。
当被问及潜在竞争威胁时,夏立雪认为当前AI市场仍处于需求大于供给的扩张期,产业链各环节存在充分的合作空间。企业发展的核心挑战在于如何承接持续涌现的应用需求,这取决于资源供给能力与利用效率的双重提升。对于AI范式变革的可能性,他表示技术演进将是渐进过程,现有商业模式在过渡期仍具价值,更深度的软硬件融合优化可带来1-2个数量级的成本下降空间。











