滚动资讯

当前位置：首页 > 资讯 > 手机快报 > 正文内容

阿里通义ThinkSound：开创链式推理音频生成新时代

时间：2025-07-09 11:00:13 来源：ITBEAR编辑：快讯团队 IP：北京 发表评论无障碍通道

阿里语音AI团队近期公布了一项重大创新，他们推出了全球首个集成链式推理功能的音频生成模型——ThinkSound。该模型凭借独特的思维链技术，成功超越了以往视频转音频技术的局限，实现了空间音频的高保真与强同步生成，标志着AI音频技术的一次飞跃式进步。

传统的视频转音频方法往往受限于对画面动态捕捉的不足，导致生成的音频与视觉事件无法精确对应。而ThinkSound则通过结合多模态大语言模型与统一音频生成架构，创新性地采用三阶段推理机制，实现了音频合成的精准控制。首先，模型解析画面的整体动态与场景语义，构建出结构化的推理链；接着，模型聚焦于具体的声源区域，结合语义信息细化声音特征；最后，用户可以通过自然语言指令实时调整音频，如添加特定环境音效或移除背景噪音。

实验数据表明，ThinkSound在多个测试集上的表现均优于主流方法。在VGGSound测试集上，其核心指标提升超过15%，在MovieGen Audio Bench测试集中更是大幅领先meta的同类模型。目前，ThinkSound的代码与预训练权重已经面向公众开源，开发者可以在GitHub、HuggingFace及魔搭社区免费获取。

ThinkSound的开源不仅为影视音效制作、音频后期处理等领域提供了新的工具，更为人机交互中的声音体验带来了无限可能。业内人士认为，这一创新将加速音频生成技术的普及，推动创作者经济向更加智能化的方向发展。用户现在可以通过访问指定的开源地址，探索并应用这一前沿技术。

开源地址:

https://github.com/FunAudioLLM/ThinkSound

https://huggingface.co/spaces/FunAudioLLM/ThinkSound

https://www.modelscope.cn/studios/iic/ThinkSound

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

苹果COO杰夫・威廉姆斯月底卸任，年底退休，库克接班人悬念再起

07-09

余承东自曝开车看手机被罚：期待L3智能驾驶，希望法规早日出台

07-09

三星Galaxy Z Fold7渲染图出炉：或舍弃屏下摄像头，主打轻薄设计

07-09

荣耀X70系列国风四色亮相，7月15日发布，打造中式美学新体验

07-09

iPhone 17系列内存大升级：Pro版配12GB，标准版仍为8GB

07-09

苹果iPhone 17e预计明春发布，继续走高性价比路线

这延续了苹果在今年 2 月首次推出 iPhone 16e 的产品线策略，意味着春季发布新款 iPhone可能将成为苹果的新常态。郭明錤此前认为，第三代 e 系列机型预计将在 2027 年上半年与标准版 iP…

07-09

iPhone维修新技巧：用户尝试低温慢煮法软化粘合剂拆机

IT之家 7 月 9 日消息，科技媒体 AppleInsider 昨日（7 月 8 日）发布博文，报道称有用户通过低温慢煮（Sousvide）的方式，来加热 iPhone，从而软化粘合剂，踏出修复的第一步。…

07-09

iOS 26 Beta3推送：首批果粉反馈争议大，更新需谨慎

以及Apple ID切换后无法更新应用，这是老毛病了，甚至可以说从Beta1延续至今，希望后续能够进行解决。整体来看，此次更新虽幅度不大，但在细节上进行了诸多优化和完善，只是从果粉反馈来说，这个细节提升并…

07-09

华为Mate80系列爆料：全新升级，性能与拍照或将再创高峰

前不久华为Pura80系列发布了，作为华为两款旗舰产品的排头兵，这次的Pura80系列自然也是有"友商想到却不敢做"的新东西，那就是一镜双目，在一颗镜头里塞下了两个长焦，可以自由移动光学组件也可公用，并减少了…

07-09

驾照新政来袭：五大变革让车主生活更便捷，安全驾驶仍是核心

07-09

华为Mate70 RS降价两千，奢华体验更亲民，高端手机新选择

Mate70 RS这回不仅给我一种奢华的视觉冲击，还很有“独特性”，毕竟陶瓷后盖配上钛金属中框，谁能不心动？有一次我在阳光暴晒的公交站刷朋友圈，那种从容自如的体验，真的让人小小得意了一下。人都是这样的，买了贵…

07-09

联想moto g100 Pro评测：军工认证加持，千元机中的全能抗造王

接着我们对手机的游戏性能进行了测试，在室温为26摄氏度的办公室环境下进行，选择非常火热的国民手游《王者荣耀》以及《和平精英》这两款手游进行帧率、功耗与温度的测试，在测试期间我们开启手机的高性能模式，关闭手机…

07-09

荣耀智慧空间携手中国移动路由器，共推智能提醒与网络安全服务

凤凰网科技讯7月8日，荣耀智慧生活官方微博发文宣布，中国移动路由已接入荣耀智慧空间App，支持YOYO建议智能提醒、上网时长智能管控、拦截诈骗网站等功能。据介绍，用户可以连接中国移动路由器至荣耀智慧空间，…

07-09

荣耀X70定档7月15日：国风四色+8300mAh超大电池引关注

同时，此次官方也正式确认了该机将内置的超大电池最终容量达到了8300mAh，由此该机成为了目前全球内置电池容量最大的手机。根据目前官宣的信息来看，荣耀X70的最大亮点就是内置了8300mAh截至当前史上容量…

07-09

华为Mate70 RS跌价两千，奢华体验更亲民，商务精英新宠？

Mate70 RS这回不仅给我一种奢华的视觉冲击，还很有“独特性”，毕竟陶瓷后盖配上钛金属中框，谁能不心动？有一次我在阳光暴晒的公交站刷朋友圈，那种从容自如的体验，真的让人小小得意了一下。人都是这样的，买了贵…

07-09

点击查看更多 +

全站最新

宝马X5或将搭载增程技术，豪华品牌向市场趋势低头？

2026款沃尔沃S90焕新上市，新老车型对比展现简约优雅新境界

中型SUV实用比拼：宝马X3、保时捷Macan新能源、小鹏G6、探岳L谁更胜一筹？

2026款东风雪铁龙天逸购车攻略：旗舰版配置升级，性价比之选

本田中国上半年销量下滑超两成，电动化转型成关键

智界产品总监展示新车标并@雷军，随后删除，称车标将赠老车主

热门内容

本栏最新

苹果iPhone 17e预计明春发布，继续走高性价比路线

iPhone维修新技巧：用户尝试低温慢煮法软化粘合剂拆机

iOS 26 Beta3推送：首批果粉反馈争议大，更新需谨慎

华为Mate80系列爆料：全新升级，性能与拍照或将再创高峰

驾照新政来袭：五大变革让车主生活更便捷，安全驾驶仍是核心

华为Mate70 RS降价两千，奢华体验更亲民，高端手机新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.