在人工智能飞速发展的当下,词元——这一大模型处理信息的最小单元,正成为智能经济领域的关键要素。我国日均词元调用量呈现出爆发式增长态势,不仅彰显出智能经济的蓬勃活力,更预示着一套全新的商业逻辑正在加速形成。随着词元可计量、可定价、可交易的特性日益凸显,人工智能有望如同水、电一般,成为支撑社会运转的基础资源。
今年3月,中国人工智能大模型交出了一份亮眼成绩单:日均词元调用量突破140万亿,短短两年间增长超千倍。如此惊人的增长速度,引发了各界对词元的广泛关注。那么,究竟什么是词元?它与人工智能产业有着怎样的紧密联系,未来又将朝着怎样的方向发展呢?记者就此展开了深入采访。
词元与常见的数据有着本质区别。文字词元宛如“乐高积木”,一个单词或汉字被拆解成一个个独立的词元;音频词元恰似“乐谱上的音符”,一段声音被切割成极短的时间片段,每个片段都蕴含着音调、音量等信息;视频词元则如同“拼图碎片”,每一帧画面被分割成一个个小方格,同时还要兼顾时间上的连续性。火山引擎智能算法负责人吴迪形象地比喻道:“在大模型眼中,三种模态的词元毫无差异,它只将它们视为一串极其复杂的数字序列进行处理。”
这些看似微小的词元,实则是智能经济运行的“细胞”。今年3月,中国人工智能大模型周词元调用量连续三周位居全球前列,成为全球大模型应用活跃度最高的国家之一。词元调用量之所以出现爆发性增长,首要原因在于模型能力的显著提升。每一次模型能力的进步,都会解锁更多应用场景,进而推动大模型词元调用量进一步激增。以Seedance(豆包视频生成模型)2.0为例,生成1分钟视频大约需要消耗超过100万个词元。
除了模型能力的提升,新的应用形态和商业模式也为词元调用量的大幅上涨提供了强大动力。例如,近期兴起的智能体与传统单轮问答截然不同,其运行过程涉及更长的上下文、更频繁的模型调用、更多轮次的任务拆解,以及工具执行过程中的持续反馈。吴迪介绍,简单任务若只需单轮或几轮工具调用即可完成,消耗词元仅需几千;而若需要几十轮工具调用,则至少要消耗几万词元甚至更多。智能体等新业态的涌现,无疑为词元调用量开辟了快速增长的新通道。
从行业分布来看,词元调用量主要集中在信息密度高、产品迭代周期快的领域。以豆包大模型2.0为例,在行业分类中,互联网行业词元调用比例最高,消费电子、金融、新零售和商务服务紧随其后。在应用场景方面,非结构化信息的处理和分析占比最大,教育、内容创作和“搜索与推荐”次之。展望未来,软件开发、深度研究、个人助理等智能体应用场景有望成为词元调用量爆发的重要领域。特别是软件开发领域,当前人工智能正从简单写代码向理解整个项目转变,不仅能排查错漏、自动优化,甚至能通过智能体自主完成整个开发任务。由于代码上下文长、交互轮次多,企业为提升效率的付费意愿较强,这将成为巨大的需求增长点。
词元的可计量特性,为人工智能产业的发展带来了全新的商业逻辑。国家数据局相关负责人透露,今年1月底以来,部分模型企业创下了20天收入超越2025年全年总收入的业绩纪录。这背后,正是一套以词元计费为基础的新型商业逻辑在加速演进。回顾人工智能产业发展历程,过去行业主要聚焦于模型性能的比拼,技术创新与商业落地之间缺乏可量化的衔接桥梁,难以形成“技术迭代—价值产出—持续投入”的良性循环。而词元具备可计量、锚定算力能耗、跨模态通用结算的特点,使其能够成为连接技术供给与商业需求的结算单位。联想中国基础设施业务群战略管理总监黄山打了个比方:“大模型输出的智能好比电,智算中心好比发电厂,电用千瓦时来计量,智能调用就用词元来计费。”展望未来的智能社会,人工智能有望像水、电一样,实现随取随用、按需购买。
从词元的角度出发,我国在打造智能经济新形态方面具备诸多优势。在算法创新领域,国产大模型通过底层架构优化,与全球顶尖技术的差距逐渐缩小。我国大模型厂商积极开展算法创新,在推理成本、响应速度上不断优化,能够以更少的词元完成复杂任务。在基础设施方面,我国拥有全球门类最全、规模最大的能源体系,电源充足、电网强大、市场活跃。随着发电供给持续提升、电力成本不断降低,能够有效降低词元调用成本。能耗和算力是词元调用的两个关键成本,让每个词元用更少的算力和能耗生产出来,体现的是智算中心等基础设施的生产能力和效率。因此,构建安全、高效、普惠的人工智能基础设施,持续提升大模型推理效率、降低单个词元成本,将推动人工智能最大程度走向规模化应用落地。







