生成式AI领域的竞争从未停歇,各家企业轮番登场。年初,DeepSeek的突然崛起吸引了大量关注,而字节跳动的豆包大模型当时并未急于发声。然而,随着6月新版模型的推出,豆包迅速反弹,重新跻身国内AI大模型的第一梯队。
业内普遍认为,字节跳动在AI领域的布局几乎没有明显短板。它不仅拥有自研大模型的底层技术能力,还掌握着抖音这一超级流量入口,并具备快速孵化App的产品体系。与其他互联网公司不同,字节跳动在AI战略上推行了一种“一盘棋”式的协同模式,这在当下国内大厂中较为少见。
在AI对话助手市场中,竞争尤为激烈。最近几周,阿里旗下的“夸克”展开了猛烈攻势,试图在这一赛道占据更多份额。而根据QuestMobile的数据,截至2025年8月,豆包App的月活用户已超过1.57亿,其主要竞争对手DeepSeek的月活约为1.43亿。数据显示,DeepSeek流失的用户中,有近四成转向了豆包,使其成为国内移动端用户量最大的AI聊天助手。
豆包App于2023年8月上线,其风格既有西方AI聊天工具的影子,也有独特的创新。字节跳动内部强调,模型能力是关键,因此豆包App更像海外产品那样,依赖后端基模能力,而非通过产品化过程中的弥补性措施来提升体验。与此同时,豆包App区别于许多西方AI聊天助手的强工具属性,主打“亲近”、“易用”风格。其图标设计为一位有亲和力的短发女性卡通形象,支持语音、视频、方言聊天,使用门槛较低。
尽管一些用户反馈豆包对深度问题的回复“不够好”,但字节跳动人士表示,这是为了降低使用门槛,使其更符合大众用户的需求,甚至包括父母和爷爷奶奶辈的用户。如果是企业用户在云上调用豆包大模型服务,其回复的专业性与其他产品相当。
今年9月,字节跳动老将赵祺接手豆包产品,负责移动端、PC端用户产品及模型策略。赵祺曾担任字节增长中台负责人和穿山甲广告平台负责人,这一任命意味着豆包的工作重心或将转向加速用户规模增长与商业变现。
对于豆包App未来是否会收费,用户看法不一。有人担心收费后会转向其他聊天助手,但考虑到豆包App承担着展示豆包大模型能力的“窗口”作用,面向所有用户“一刀切”收费的可能性并不大。目前,更可能的变现路径包括围绕特定需求场景推出按次计费服务、针对企业或高频创作需求设置“超额使用收费”、在抖音生态中嵌入豆包功能获取广告分成或佣金,以及广告类收入。
豆包App的底座是豆包大模型。在基础大模型层面,中外大厂的竞争非常激烈。目前,豆包大模型与DeepSeek、阿里Qwen处于国内第一阵营,各有优势,但与海外最先进模型相比仍有差距。尤其是最近半年,国内部分业界认为中外模型的差距实际在加大。
今年,豆包大模型上演了反转之路。年初DeepSeek爆火和阿里Qwen开源知名度提升时,字节跳动一度保持沉默,但内部用了数十倍于DeepSeek的人力快速迭代模型。6月,在火山引擎年度Force大会上,字节跳动发布了豆包大模型1.6版。由于这是国内首个原生多模态模型,在长上下文、性价比上表现突出,豆包大模型的处境逐步逆转,再次晋身国内最强模型阵营。
数据也显示,豆包大模型增速极快,生态规模扩张迅速。截至2025年9月底,豆包大模型的日均tokens调用量已突破30万亿,相比今年5月底增长超80%,表明其落地进展极快。
不过,豆包大模型在海内外的声量完全不同。由于海外主要市场不提供API服务,且极少有开源模型,豆包大模型在各大论坛中只有零星讨论,热度低于DeepSeek和Qwen。在一些开发者自发的评测中,豆包在中文理解、多模态理解、视频生成中表现优异,但在代码生成、复杂API调用等任务上,不如海内外某些专门优化的模型或竞品强。开发者普遍认为,Qwen、豆包、DeepSeek“用下来各有优劣”。
业内比较统一的评价是,豆包大模型在视频(Seedance系列)、图像(Seedream系列)、语音(实时语音/克隆)多模态产品化与矩阵完整度上占有优势。其上线较早、多模态能力更全、云上价格更低、场景跑得更深。但在单项榜单与研究侧,阿里与DeepSeek也有亮点。豆包大模型在多模态上的强投入,或与其将在接下来商业化大浪中抓住机会紧密相关。
豆包大模型隶属于字节集团Seed部门。在Force大会期间,火山引擎智能算法负责人吴迪提到豆包大模型时表示,“我们可以用一些非常高效的结构,来做到世界头部排名的大模型。”2025年初,Seed核心领导层发生重要变动。前Google DeepMind副总裁、曾参与Gemini模型开发的吴永辉博士加入,担任Seed部门模型基础研究负责人。曾牵头开发豆包大模型、也是字节第一版推荐算法负责人朱文佳,任Seed模型应用能力负责人。
字节跳动在AI战略上采取的“一盘棋”打法,体现在品牌、产品互动、引流、商业化等方方面面。豆包大模型最早在字节内部的研发代号为Skylark(云雀),2023年8月对外发布时名为“云雀大模型”,但在2024年5月更名为“豆包大模型”,对外文档、API等全部替换为“豆包”。更名方便了用户建立模型与产品之间的直接关联,一些用户在消费端体验了豆包App后,也直接推动其在企业级市场选择豆包大模型。
例如,由于豆包在消费者市场的用户体验,使其直接延伸到手机、AI陪伴玩具和汽车智能座舱。在vivo、荣耀等近期召开的开发者大会中,手机助手选择的模型底座之一是豆包大模型。火山引擎CEO谭待表示,豆包大模型与几家车厂在座舱上进行了共创,并在“座舱交付上有很多伙伴”。
与此同时,2024年以来,字节跳动以前所未有的速度,密集推出了覆盖各种应用的AI原生矩阵,借助豆包大模型能力,实现新一轮App输出。像即梦(AI短视频生成)、海绵音乐(AI音乐生成)、猫箱(AI虚拟角色聊天互动,对标MiniMax星野)、星绘(AI图像美化工具,对标妙鸭相机等)、河马爱学(K12与成人学习)、即创(为抖音商家设计的AI内容创作工具,服务抖音电商生态)。在海外则复制国内经验,形成Cici(海外版“豆包”)、Gauth(AI解题工具)、Hypic(类似“星绘”)等,而海外App与国内不相同的地方,是采用了一些海外模型。
抖音成为这些应用引流的关键渠道。根据QuestMobile的数据,2025年3月抖音(含极速版)月活达10.01亿。抖音的定位并不仅是短视频平台,更像一个万能入口,大量内容在上面分发,甚至有一天,火山引擎这样的企业级产品也可能在上面售卖。
一位人士透露,在抖音上售卖上百万元的广告,字节内部的结算价格仅为几万元。因此,字节内部产品线都会在抖音上大力推广。除了广告推广,这些AI原生应用与抖音在产品层上的引流也更紧密。抖音正在测试接入豆包AI能力,有两个入口可直接进入豆包,无需额外下载豆包App。同时,在豆包中生成的内容,也可以直接分享到抖音,还带有豆包水印,形成双向互动闭环。
除了创造AI原生应用,豆包大模型在字节内部诸多已有产品中,先形成一个个“小闭环”。如豆包大模型已应用于抖音、飞书、番茄小说等字节内部超过50个业务场景。在火山引擎上,大量产品都是先在内部跑通,再上到云端对外服务。比如Data Agent这个产品,在BI数据决策基础上,提供更深度、灵活洞察能力的产品,已在抖音内部使用。
火山引擎CEO谭待表示,与其他大模型企业最大的区别之一是,“我们跟抖音商业化可以做一些联动”。在双11电商大战期间,内部各产线在AI上的闭环更多。比如,在飞书多维表格中,集成了文案生成、即梦图片和视频生成工具,能批量帮助商家生成文案、图片和视频,通过自动化工具导入剪映,完成一个视频的剪辑,再一键发布到抖音上。
豆包大模型是当下字节高层布局和关注的焦点。公开信息称,从2024年下半年开始,张一鸣每月会参加一次字节跳动“Seed”核心技术团队的复盘和讨论会。新调任豆包产品的负责人赵祺,曾担任AI条线人力资源负责人,有分析认为这可加强跨团队协同与组织整合。
整体来看,字节AI体系已初步形成模型、产品布局,并通过“一盘棋”式加速闭环和商业化。然而,这场快速奔跑背后仍潜藏挑战。字节跳动如何在保持应用速度与流量的同时,追赶与OpenAI、谷歌等全球巨头的模型差距,探索国内外市场的商业变现路径,构建产品形态变革,以及克服自研芯片与基础设施层面的挑战,仍有待观察。











