火山引擎在近日举办的原动力大会上,正式推出了豆包大模型1.8版本以及音视频创作模型Seedance 1.5 pro。这两款新产品的发布,标志着该公司在人工智能领域的技术实力再上新台阶。权威评测结果显示,豆包大模型在多模态理解、生成能力以及Agent能力方面,已成功跻身全球领先行列。
据火山引擎总裁谭待透露,截至目前,豆包大模型的日均token使用量已突破50万亿大关,与去年同期相比增长超过10倍。这一数据充分显示了市场对豆包大模型的广泛认可和高度需求。同时,已有超过100家企业客户的累计token使用量超过一万亿,进一步证明了豆包大模型在企业级应用中的强大实力。
作为豆包家族的最新旗舰,豆包大模型1.8针对多模态Agent场景进行了深度优化。该模型在工具调用、复杂指令遵循以及OS Agent能力方面均得到了显著提升,从而大幅增强了模型在处理复杂任务时的规划与执行能力。特别是在视觉理解方面,豆包1.8的单次视频理解帧数从640帧提升至1280帧,支持以低帧率理解超长视频,并能调用工具对关键片段进行高帧率理解,为在线教育、产品质检等领域提供了强大的技术支持。
在多项公开评测中,豆包1.8展现出了卓越的性能。在视觉推理、通用视觉问答、空间理解及视频理解等任务中,该模型均取得了最佳或接近最佳的成绩。在通用智能体测评集BrowserComp上,豆包1.8的表现更是领先全球。在数学与推理等基础能力维度上,豆包1.8的整体水平也已接近全球顶尖的通用模型。
为了满足日益增长的视频创作需求,火山引擎还推出了Seedance 1.5 pro音视频创作模型。该模型不仅具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了重大突破。Seedance 1.5 pro采用创新的原生音视频联合生成架构,支持环境音、背景音乐、人声等多种元素,实现了毫秒级的音画同步输出。在对白处理上,该模型支持多人多语言对话,口型对齐精准,覆盖中文方言、英文及小语种,极大地提升了视频内容的真实感和全球化创作潜力。
为了进一步降低创作门槛和成本,Seedance系列即将上线“Draft样片”功能。创作者可以先生成低分辨率样片进行预览,其关键要素与最终成片高度一致,真正做到“预览即所得”。据数据显示,该功能可帮助创作者提升65%的整体效率,并减少60%的无效创作成本。目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可从指定日期起,通过火山引擎API接入Seedance 1.5 pro模型服务。
谭待在大会上指出,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。为此,火山引擎全面升级了企业级AI Agent平台——AgentKit,覆盖了Agent从开发、部署到管控的全生命周期,旨在解决企业在Agent落地中面临的核心挑战。同时,火山引擎还推出了HiAgent智能体工作站,通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与应用。
为了降低企业使用门槛,火山引擎还推出了业内首个“AI节省计划”。该计划覆盖所有按量后付费的大模型产品,通过阶梯式折扣,帮助企业最高节省47%的成本。这一举措无疑将进一步推动AI技术在各行各业的普及和应用。









