滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

豆包音频生成模型1.0问世，AI助力音频创作迈向“创意导演”新阶段

时间：2026-06-24 16:40:16 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能技术持续重塑内容创作领域的进程中，火山引擎近日推出了一项具有行业突破性的成果——豆包音频生成模型1.0正式亮相。这款模型凭借两大核心技术，为音频制作领域带来了颠覆性变革，重新定义了专业音频创作的效率与可能性。

传统音频制作流程中，创作者需面对繁琐的后期工作。以制作一段达到成片标准的音频为例，创作者需分别生成对白、音效和配乐，再通过手动对齐与混音实现最终效果。这一过程不仅耗时耗力，更对创作者的专业技能提出极高要求。而豆包音频生成模型1.0的出现，将这一复杂流程大幅简化。用户只需输入包含角色台词、情绪语气、背景音乐及环境氛围的完整描述指令，模型即可直接生成具有叙事张力的完整音频作品，彻底改变了传统音频制作的底层逻辑。

针对长音频创作中普遍存在的“角色声音不一致”难题，该模型通过文生音频与参考音频的深度融合技术，实现了跨段落的声音特性稳定保持。无论是创作长篇有声书还是复杂播客内容，模型在多次音频延长过程中，都能确保角色声音的前后一致性。这种能力有效解决了专业创作者在长程生成场景中的核心痛点，为高质量长音频内容的规模化生产提供了技术保障。

在音频风格控制领域，该模型展现出强大的创新潜力。其“0样本多模态音频创造”功能支持通过文本描述或参考音频直接生成目标音频，无需额外训练即可获得高质量成果。更值得关注的是，模型实现了音色与风格的深度解耦，支持“一声多角”的灵活演绎。同一个声音源可在不同情绪和场景中展现差异化表现力，这种技术突破显著降低了专业音频制作的技术门槛，为创作者提供了更广阔的创作空间。

目前，火山方舟平台已开启该模型的API邀请测试，个人用户可获得30分钟的免费创作额度。随着技术即将在剪映、即梦及番茄等主流内容平台落地应用，音频创作正从传统的“剪辑拼接”模式向“创意导演”模式加速转型。这一技术革新不仅代表着音频生成领域的重大突破，更预示着人工智能正在成为内容创作者不可或缺的数字化工具，为整个行业注入新的发展动能。

更多>同类资讯

火山引擎豆包音频生成模型1.0来袭：一键生成完整音频，长音频音色始终如一

06-24

豆包推出三档付费订阅服务：高性价比策略能否助力其在竞争中突围？

06-24

千问发布Qwen-AgentWorld：AI智能体迈向多环境适配新征程

06-24

ChatGPT语音功能大革新：双向并行处理，开启人机对话自然流畅新体验

06-24

杭州西湖日启幕：AI邂逅文旅传统景区焕发科技新魅力

06-24

米哈游论文探索：100个AI智能体在虚拟世界开启十年“人生”新旅程

这些智能体不再是传统游戏中只会按照预设脚本行动的NPC，它们由语言模型驱动，每个人拥有独特的背景、性格、技能和社交关系，会在虚拟世界中做出各种行为。这意味着，游戏公司可以利用内部模拟来优化智能体模型，…

06-24

极氪8X“越跑电越多”引热议，张朝阳点赞，AI赋能电混技术新突破

06-24

腾势N8L闪充版正式登场：续航强劲配置丰富，智能座舱“迪迪虾”亮相

06-24

维基百科联合创始人：AI“幻觉”问题仍突出，暂不开放其直接编辑词条

06-24

游戏开发用AI遭“偏见”：优质项目或因负面口碑错失成功？

06-24

豆包专业版重磅上线：办公任务模式升级，支持本地操作与Agent任务，月费最高500元

06-24

豆包正式推出专业版，包月最低68元最高500元

6月24日，豆包正式推出专业版，并同步上线全新的办公任务模式。该产品基于最新的豆包2.1系列大模型打造，面向办公、开发、数据分析、设计创作等专业生产力场景，进一步拓展AI在工作中的应用能力。据了解，豆包专业版接入旗舰级豆包2.1 Pro模型，在提供更强模型能力的同

06-24

霍启刚谈AI浪潮：青年培养需重思维构建借AI拓展能力边界

06-24

台积电7nm及以下先进制程全面涨价，AI需求成背后关键推手

06-24

通用汽车“零号工厂”装50台机器人，千余被裁员工复工前景堪忧

06-24

点击查看更多 +

全站最新

2026款奥迪A6L e-tron来袭！3米1轴距+800V超充，续航最长815km

6月30日登场！宝马X5首创五动力同车，自研芯片统管全系底盘

德国专家旧论引热议：电动车污染真比燃油车大？真实数据算清账

东风奕派M8 6月28日开启预售纯电增程双动力+华为乾崑技术六件套

法拉利首款纯电Luce发布遇挫营销高管离职引外界猜测

五大平台种草逻辑大不同：母婴品牌如何精准匹配平台特性？

热门内容

本栏最新

米哈游论文探索：100个AI智能体在虚拟世界开启十年“人生”新旅程

中国工程院院士李骏：2026年自动驾驶安全监管迎拐点，迈入Safety Case新阶段

从30秒造车到托起大飞机重庆“智造天团”以硬核实力书写中国式现代化新篇

火山引擎FORCE大会：豆包2.1 Pro与Seedance 2.5登场，国产AI模型再攀高峰

零跑D99 6月25日上市！超5米车身+双动力，智能座舱芯片行业首发

中科院固态电池新突破：循环性能提升，多产业未来十年或迎变革

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.