滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

阿里通义实验室开源音频生成新模型ThinkSound，革新视频转音频技术

时间：2025-07-05 21:04:53 来源：凤凰网科技编辑：快讯 IP：北京 发表评论无障碍通道

阿里通义实验室近期在音频技术领域取得了突破性进展，正式推出了名为ThinkSound的音频生成模型，并宣布将其开源。这一创新之举标志着音频生成技术迈入了一个全新的阶段，特别是将思维链（CoT）技术首次应用于音频生成领域。

据通义语音团队介绍，传统的视频转音频（V2A）技术往往难以精准捕捉视觉与声音之间的时空关联，导致生成的音频与视频中的关键事件存在错位现象。而ThinkSound模型则通过引入结构化推理机制，模拟人类音效师的工作流程，有效解决了这一问题。它首先理解视频的整体画面与场景语义，然后聚焦于具体的声源对象，最终响应用户的编辑指令，逐步生成高保真且与视频同步的音频。

为了训练ThinkSound模型，通义语音团队构建了首个支持链式推理的多模态音频数据集AudioCoT。该数据集包含了超过2531小时的高质量样本，涵盖了丰富的场景，并特别设计了面向交互编辑的对象级和指令级数据。ThinkSound模型由两个核心部分组成：一个多模态大语言模型负责“思考”推理链，而另一个统一音频生成模型则负责“输出”声音。

在多项权威测试中，ThinkSound模型的表现均优于现有的主流方法，这充分证明了其技术的先进性和实用性。目前，该模型已经正式开源，开发者可以在GitHub、Hugging Face以及魔搭社区等平台上获取相关的代码和模型文件。这一举措无疑将为音频生成技术的发展注入新的活力，推动相关领域的研究和应用不断向前迈进。

对于未来，虽然未具体提及拓展计划，但ThinkSound模型在游戏、虚拟现实（VR）/增强现实（AR）等沉浸式场景中的应用前景被广泛看好。随着技术的不断成熟和完善，相信它将为用户带来更加真实、生动的音频体验。

更多>同类资讯

康明斯零部件：低碳与电动化并进精准布局满足中国市场多元需求

03-16

康明斯零部件：紧跟低碳与电动化趋势多元布局满足市场新需求

03-16

DeepSeek V4、姚顺雨新混元模型被曝下月发布，两大国产AI巨头同台竞技

03-16

康明斯零部件：低碳布局与电动化并进精准匹配市场多元需求

03-16

2026年我国再添“天眼”：遥感五十号02星成功发射入轨

IT之家 3 月 15 日消息，据央视新闻报道，北京时间 2026 年 3 月 15 日 21 时 22分，我国在太原卫星发射中心使用长征六号改运载火箭，成功将遥感五十号 02 星发射升空，卫星顺利进入预定…

03-16

2026年我国长征六号改火箭成功送遥感五十号02星入轨助力多领域发展

月 15 日消息，据央视新闻报道，北京时间 2026 年 3 月 15 日 21 时 22分，我国在太原卫星发射中心使用长征六号改运载火箭，成功将遥感五十号 02 星发射升空，卫星顺利进入预定轨道，发射任务…

03-16

箭元科技“元行者一号”进展不断：验证试验成功，预计2026年底首飞

IT之家 3 月 15 日消息，据《科创板日报》今日报道，箭元科技“元行者一号”可回收运载火箭预计 2026年底首飞，“元行者一号”运载火箭是国内首款采用“不锈钢 + 液氧甲烷 + 海上回收”方案的火箭型号…

03-16

2026年3月15日遥感五十号02星成功发射长征系列火箭再添新功

北京时间2026年3月15日21时22分，我国在太原卫星发射中心使用长征六号改运载火箭，成功将遥感五十号02星发射升空，卫星顺利进入预定轨道，发射任务取得圆满成功。该卫星主要用于国土普查、农作物估产和防灾减灾…

03-16

阅文作家助手内测Claw功能，AI赋能网文创作开启新篇章

03-16

箭元科技“元行者一号”进展神速：验证试验成功，2026年底有望首飞

03-16

2026年3月15日长征六号改火箭升空遥感五十号02星开启太空新征程

03-16

3月15日长征六号改火箭升空遥感五十号02星开启国土普查新征程

03-16

箭元科技“元行者一号”：国内首款不锈钢火箭，2026年底将迎首飞

03-15

2026年3月15日遥感五十号02星成功升空长征系列火箭再添新功

03-15

两部门：贷款人开展个人贷款业务时应当向借款人展示综合融资成本明示表

03-15

点击查看更多 +

全站最新

新能源车企爆雷后车主众生相：高合修车难极越智驾废威马哪吒各有苦

戈登·瓦格纳奔驰收官之作：smart #6融合过往经典，开启未来新章

新能源车门把手大变革：从隐藏式退场到安全成首选，你选车会看重吗？

康明斯零部件：低碳与电动化并进精准布局满足中国市场多元需求

长城汽车海外布局加速，销量攀升溢价显著，海外市场“一车难求”成常态

大众汽车“跨界”新玩法：电动办公椅亮相，配音响倒车影像速度还不慢

热门内容

本栏最新

康明斯零部件：低碳与电动化并进精准布局满足中国市场多元需求

康明斯零部件：紧跟低碳与电动化趋势多元布局满足市场新需求

康明斯零部件：低碳布局与电动化并进精准匹配市场多元需求

深铁前海时代尊府建面约88-235㎡新品亮相

暴力裁员1.6万！

地缘冲突+AI浪潮驱动，这个赛道迎来爆发周期！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.