滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Meta推出SAM Audio：多模态提示助力音频分离更智能高效

时间：2025-12-18 05:36:23 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

meta公司近日在音频技术领域取得重大突破，正式推出全球首款统一多模态音频分离模型——SAM Audio。该模型通过融合文本、视觉及时间维度提示，实现了对复杂音频场景的智能解析，标志着音频处理技术向人性化交互迈出关键一步。

研发团队介绍，SAM Audio的核心创新在于其感知编码器视听系统（PE-AV），这项技术源自meta今年早些时候开源的感知编码器模型。通过将计算机视觉的精准识别能力与音频处理深度结合，PE-AV如同为系统装上"数字耳朵"，能够准确捕捉声源特征。在实际演示中，用户仅需点击视频中的吉他，系统即可瞬间分离出纯净的吉他声，即便在交响乐合奏等复杂场景中依然保持高精度。

该模型提供三种创新交互模式：文本提示支持用户输入"婴儿啼哭"或"汽车引擎"等关键词提取特定声源；视觉提示允许通过点击视频中的发声物体实现音频分离；行业首创的时间片段提示功能更可标记特定时间段，实现跨时长音频处理。例如在播客录制场景中，用户可一次性标记所有出现手机铃声的时间段进行批量消除。

为验证模型性能，meta同步推出两大评估体系：SAM Audio-Bench作为首个真实场景音频分离基准测试，涵盖演唱会、街头采访等20类复杂声学环境；SAM Audio Judge自动评估模型则通过机器学习构建音质评分标准，实现毫秒级处理效率。这些工具将为行业提供标准化的性能评估框架。

技术文档显示，PE-AV系统在保持轻量化设计的同时，实现了参数效率的显著提升。相较于传统音频处理模型，其计算资源消耗降低40%，分离精度提升27%。该成果已应用于meta旗下多款产品的音频优化模块，开发者可通过开放接口调用核心功能。

更多>同类资讯

百度搭子DuMate登陆苹果App Store，多端协同开启AI协作新体验

06-17

阿里发布Qwen-Robot系列具身智能大模型助力机器人“手脑脚”协同进化

VLA（Vision-Language-Action，视觉-语言-动作）模型是当前具身智能最核心基础模型之一，它将视觉感知、语言理解和动作决策融合，让机器人看得懂、能动手。 Qwen-RobotWorld…

06-17

司庆日展现AI新进展，科大讯飞多领域布局角逐全球科技之巅

走过27年，科大讯飞正在把"能理解、会思考"延伸到"能干活、能感知"。在刚过去的司庆日，这家公司以几项实质进展，勾勒出其AI产业化纵深布局的完整轮廓。首先是工业具身智能的突破。其次是消费端AI眼镜的即将落地，…

06-17

雷军15小时直播无疲惫感：热爱成动力，实干创业者值得深思与学习

#雷军称 15 小时直播没觉得辛苦 #直播结束后的专访内容刷屏全网，长达十五小时不间断超长直播带货，全程保持饱满状态，互动讲解、产品演示、福利发放全程在线，结束后采访被问及超长时长直播是否疲惫时，雷军直言完全…

06-17

京东视觉语言实时交互模型JoyAI-VL-Interaction将开源多场景评测表现亮眼

06-17

Sensor Tower报告：ChatGPT仍居首但份额首破50% AI助手竞争格局生变

06-17

“大空头”伯里质疑SpaceX估值：想做空却因期权贵放弃，称万亿估值无依据

06-17

智谱AI发布开源GLM-5.2模型：1M无损上下文助力长程任务开发新突破

06-17

刚被SpaceX收购的Cursor发布新模型：1.5万亿参数 10万GPU训练

06-17

高盛首评零跑汽车“买入” 目标价50港元看好海外销量增长潜力

06-17

菜鸟于荷兰再落子：2.6万平新中心将启用，百台自研机器人助力欧洲供应链

06-17

绿联新款10000mAh移动电源上架：45W带屏自带线，售价199元

06-17

京东方第8.6代AMOLED产线在成都量产填补国内空白引领高端OLED新潮流

06-17

豆包股价格再上调至14.85美元，增速超字节期权未来或频繁涨价

06-17

抖音“反诈万里行”启程：AI风控助力，携手各界筑牢反诈安全网

06-17

点击查看更多 +

全站最新

传祺全新向往M8 PHEV L登场，外观精致内饰新，大7座配插混超实用

日产Serena来袭！18万多合资混动七座，家用优势尽显，GL8不香了？

哈尔滨免拆治理烧机油怎么选？31年老店伟锋汽配厂经验足不换件更靠谱

氢能车3分钟换氢续航120公里，看似完美却难替代传统电动车？

5个多小时实测直播！小米YU7新标准版与GT挑战26项严苛测试见真章

蔚来科大讯飞加持，博士师徒掌舵的主线科技自动驾驶卡车，上市前仍在“烧钱”前行

热门内容

本栏最新

5个多小时实测直播！小米YU7新标准版与GT挑战26项严苛测试见真章

蔚来科大讯飞加持，博士师徒掌舵的主线科技自动驾驶卡车，上市前仍在“烧钱”前行

从造车到聚人：猛士以社群为纽带打造越野全周期生态新范式

吉利银河TT全球征名脱颖而出最高725km续航引领C级纯电轿车新潮流

车市格局生变：电车“常驻”与油车“徘徊”，车企如何破局？

从情怀买单到理性选择：小米SU7两代用户消费转向，收入高知群体更重技术与实用

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.