ITBear旗下自媒体矩阵:

字节跳动AI新棋局:以Token为棋子,在硬件与企业端掀起行业新浪潮

   时间:2025-12-26 05:10:14 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

在AI技术飞速发展的当下,字节跳动正以独特的“Token经济”模式,在行业内掀起新一轮竞争浪潮。Token作为大模型交互的核心单元,其调用量已成为衡量模型应用广度与深度的重要指标。字节跳动旗下火山引擎最新披露的数据显示,截至2025年12月,豆包大模型日均Token调用量突破50万亿,半年内增长200%,同比增幅达10倍,全球范围内仅次于OpenAI与Google。

火山引擎总裁谭待指出,AI云原生架构下,模型已成为软件系统的核心驱动力。大模型能力的持续进化不断解锁新场景,直接推动Token使用量攀升。尽管当前火山引擎的Token消耗中,字节内部业务占据相当比例,但已有超过100家外部客户累计使用量突破万亿级。这种增长态势背后,既源于模型技术实力的提升,也与字节在算力投入与市场拓展上的激进策略密不可分。据报道,字节计划2026年投入1600亿元加码AI,其中半数预算用于采购AI芯片,这一数额接近其2025年净利润的四分之一。

在应用层面,字节同样展现出强劲的扩张势头。豆包App日活跃用户数于12月突破1亿大关,成为国内用户规模最大的AI原生应用。更值得关注的是,其用户增长与市场推广成本创下字节历史新低。与此同时,火山引擎与中央广播电视总台达成合作,成为2026年春晚独家AI云合作伙伴,豆包App将推出系列互动玩法,进一步扩大品牌影响力。

字节的Token战略在硬件领域同样布局深远。2025年下半年以来,火山引擎通过“甩卖”模式,将AI硬件、AI玩具等高消耗产品作为重点推广对象。某AI英语学习硬件公司透露,其产品售价200余元,此前自建服务器成本高昂,后改用火山引擎云端大模型,用户可永久调用,年算力成本仅50至80元。另一家AI玩具厂商则表示,用户实际调用Token总量较低,云厂商仍能实现盈利。为支持硬件生态,火山引擎基于豆包大模型1.8推出玩具AI框架、音频AI框架等开发套件,授权模式灵活多样。

在C端优势的支撑下,字节正将豆包App的能力通过“豆包助手API”形式向开发者与硬件厂商开放。该API已实现日常沟通、联网搜索等功能,未来还将拓展拍照识图、实时翻译等场景。其定价模式采取“后付费”,单次调用价格虽高于直接购买Token,但省去了企业自建系统的成本。这种“卖饮料”而非“卖水”的策略,旨在吸引更多企业快速接入AI服务。

手机领域成为字节拓展Token消耗的新战场。2025年12月,豆包手机助手在中兴nubia M153系列手机上实现操作系统级高权限,可完成跨平台比价、点外卖等任务,但随即遭遇微信、淘宝等超级App的限制。字节并未因此止步,转而与vivo、联想、传音等厂商推进AI手机合作,通过预装插件获取用户入口。这一举措凸显了字节对手机这一最大硬件载体的野心。

企业端仍是Token消耗的主战场。谭待透露,火山引擎每日Token调用量中,企业用户占比达80%,个人用户占20%。与云时代企业和个人用量8.5:1.5的比例相比,AI时代个人用户占比有所上升,但企业端仍是核心。超过100家企业在火山引擎上的Token使用量突破万亿级,这一数字已具备国际竞争力。OpenAI此前披露的30家万亿级客户中,教育、销售、编程等领域占据主导,与火山引擎的客户结构形成呼应。

大模型进入应用落地期后,Token消耗成为衡量规模化程度的关键指标。昆仑万维董事长方汉表示,公司通过考核程序员的Token调用量来评估工作投入度。然而,真正推动Token大规模消耗的,仍需依赖多模态与Agent技术的成熟。当前企业落地Agent面临两大挑战:一是身份与权限管理,需同时协调人、Agent、工具与系统之间的关系;二是模型的确定性与可解释性,缺乏合理的评估机制导致企业难以信任AI决策。企业现有业务系统并非为Agent设计,如何实现安全可控的调用成为关键。

为破解这些难题,火山引擎在“FORCE原动力大会”上发布多款企业端产品。Trae企业版支持10万文件、1.5亿行代码容量,字节内部已有超九成工程师使用其辅助开发;抖音生活服务中40%的代码由AI生成。企业级Agent平台Agentkit则与多模态数据湖打通,提升模型处理能力。同时,火山引擎推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%成本,并启动“方舟协作奖励计划”,向企业与个人赠送数百万Token,消费多少返多少。

面对字节的攻势,阿里云也在调整策略。尽管阿里云在整体营收规模上位居行业前列,但其优势集中在PaaS、IaaS领域,而火山引擎则聚焦于MaaS市场。阿里云相关人士表示,模型质量不能仅以Token消耗衡量,更应关注“有效调用”。2025年9月,阿里云推出Qwen3-Next系列架构模型,在20万Token以上推理速度更快,旨在减少无效输出。然而,在字节的激烈竞争下,阿里云已开始制定提升Token调用量的计划,包括推广C端应用与硬件产品。下半年,阿里先后推出千问App、灵光、阿福等AI应用,其中千问App公测一周下载量突破1000万次。硬件方面,夸克AI眼镜3天销量超3000台,钉钉上线企业级AI Agent硬件DingTalk Real,标志着阿里与字节的Token之争全面升级。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version