字节跳动旗下火山引擎近日宣布,将于2026年2月14日推出豆包大模型系列的重要升级版本,涵盖豆包大模型2.0、音视频创作模型Seedance 2.0以及图像创作模型Seedream 5.0 Preview。此次升级聚焦基础能力突破与场景化应用,标志着豆包大模型家族在多模态领域的技术实力迈入新阶段。
豆包大模型2.0作为核心升级产品,将显著提升基础模型性能与企业级Agent能力。该版本通过优化算法架构与训练数据,在逻辑推理、长文本处理等任务中展现更强适应性,同时强化了企业场景下的任务自动化与决策支持能力,可满足金融、医疗等行业的复杂需求。
音视频创作模型Seedance 2.0的升级亮点集中于交互复杂度与场景适配性。其运动生成算法达到行业领先水平,可精准模拟人物动作、物体运动等细节;多模态输入支持音频、视频、图像的联合处理,实现跨模态内容生成;在影视制作、广告营销等领域,输出质量已达到工业级交付标准,显著降低专业内容生产门槛。
图像创作模型Seedream 5.0 Preview首次引入实时检索增强技术,通过动态调用最新知识库,可精准响应时效性创作需求,例如结合实时新闻生成配图。该版本还强化了多语言支持与跨文化理解能力,内置科技、人文等领域知识图谱,使生成内容更具专业深度。在图像一致性方面,模型通过改进注意力机制,有效提升了主体特征保留与图文语义对齐水平。
回顾发展历程,火山引擎在2024年12月的FORCE原动力大会上曾发布豆包大模型1.8与Seedance 1.5 pro版本。经过持续迭代,当前豆包大模型家族在多模态理解、生成能力及Agent智能化水平上已跻身全球第一梯队。数据显示,截至2025年12月,豆包大模型日均Tokens使用量突破50万亿,位居中国第一、全球第三,超过100家企业的累计Tokens使用量超万亿,覆盖互联网、传媒、零售等多个行业。
此前发布的豆包大模型1.8已针对多模态Agent场景进行专项优化,通过增强工具调用、复杂指令解析及操作系统级Agent能力,显著提升了视觉理解基础性能,并原生支持智能上下文管理,为本次升级奠定了技术基础。











