滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

火山引擎豆包音频生成模型1.0来袭：一键生成完整音频，长音频音色始终如一

时间：2026-06-24 16:39:40 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

火山引擎近日推出了一款名为豆包音频生成模型1.0（Doubao-Seed-Audio 1.0）的创新产品，标志着音频创作领域迎来重大变革。这款模型突破传统音频制作模式，支持以文本或音频为输入，通过单一指令即可生成包含对白、音效和背景音乐的完整音频作品，彻底颠覆了人工多轨剪辑的繁琐流程。

在传统音频制作中，创作者需要分别生成对白、音效和配乐，再通过手动对齐和多轨混音完成作品，这一过程不仅耗时耗力，还高度依赖专业后期技术。豆包音频生成模型1.0将这一复杂流程简化为一条指令：用户只需在提示词中定义角色台词、语气、情绪节奏，嵌入笑声、叹息等细节，模型即可同步生成背景音乐与环境音效，直接输出可上线的成品内容，如有声剧、播客节目或品牌音频。

针对长音频创作中角色音色前后不一致的痛点，该模型通过文生音频与参考音频的深度联动技术，实现了单次2分钟音频创作及多次延长功能下的音色统一。这意味着在有声书、播客或长剧集等场景中，角色在第1分钟与第10分钟的音色将保持高度一致，创作者无需反复比对修音，显著提升了制作效率与作品质量。

更值得一提的是，模型支持音色与风格的解耦控制，同一音色可适配不同情绪和语境，甚至实现“一声多角”的差异化表达。例如，同一个声音可在不同角色设定下呈现截然不同的语气特征，为角色配音和创意音频生产提供了更大灵活性。目前，火山方舟已开放API邀测，个人用户可在体验中心获得30分钟免费创作额度，该模型也将陆续接入剪映、即梦、番茄等平台。

更多>同类资讯

豆包推出三档付费订阅服务：高性价比策略能否助力其在竞争中突围？

06-24

千问发布Qwen-AgentWorld：AI智能体迈向多环境适配新征程

06-24

ChatGPT语音功能大革新：双向并行处理，开启人机对话自然流畅新体验

06-24

杭州西湖日启幕：AI邂逅文旅传统景区焕发科技新魅力

06-24

米哈游论文探索：100个AI智能体在虚拟世界开启十年“人生”新旅程

这些智能体不再是传统游戏中只会按照预设脚本行动的NPC，它们由语言模型驱动，每个人拥有独特的背景、性格、技能和社交关系，会在虚拟世界中做出各种行为。这意味着，游戏公司可以利用内部模拟来优化智能体模型，…

06-24

极氪8X“越跑电越多”引热议，张朝阳点赞，AI赋能电混技术新突破

06-24

腾势N8L闪充版正式登场：续航强劲配置丰富，智能座舱“迪迪虾”亮相

06-24

维基百科联合创始人：AI“幻觉”问题仍突出，暂不开放其直接编辑词条

06-24

游戏开发用AI遭“偏见”：优质项目或因负面口碑错失成功？

06-24

豆包专业版重磅上线：办公任务模式升级，支持本地操作与Agent任务，月费最高500元

06-24

豆包正式推出专业版，包月最低68元最高500元

6月24日，豆包正式推出专业版，并同步上线全新的办公任务模式。该产品基于最新的豆包2.1系列大模型打造，面向办公、开发、数据分析、设计创作等专业生产力场景，进一步拓展AI在工作中的应用能力。据了解，豆包专业版接入旗舰级豆包2.1 Pro模型，在提供更强模型能力的同

06-24

霍启刚谈AI浪潮：青年培养需重思维构建借AI拓展能力边界

06-24

台积电7nm及以下先进制程全面涨价，AI需求成背后关键推手

06-24

通用汽车“零号工厂”装50台机器人，千余被裁员工复工前景堪忧

06-24

孙正义推迟退休计划：投身AI领域再战十余年引领软银转型机器人公司

06-24

点击查看更多 +

全站最新

2026款奥迪A6L e-tron来袭！3米1轴距+800V超充，续航最长815km

6月30日登场！宝马X5首创五动力同车，自研芯片统管全系底盘

德国专家旧论引热议：电动车污染真比燃油车大？真实数据算清账

东风奕派M8 6月28日开启预售纯电增程双动力+华为乾崑技术六件套

法拉利首款纯电Luce发布遇挫营销高管离职引外界猜测

五大平台种草逻辑大不同：母婴品牌如何精准匹配平台特性？

热门内容

本栏最新

米哈游论文探索：100个AI智能体在虚拟世界开启十年“人生”新旅程

中国工程院院士李骏：2026年自动驾驶安全监管迎拐点，迈入Safety Case新阶段

从30秒造车到托起大飞机重庆“智造天团”以硬核实力书写中国式现代化新篇

火山引擎FORCE大会：豆包2.1 Pro与Seedance 2.5登场，国产AI模型再攀高峰

零跑D99 6月25日上市！超5米车身+双动力，智能座舱芯片行业首发

中科院固态电池新突破：循环性能提升，多产业未来十年或迎变革

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.