ITBear旗下自媒体矩阵:

雷军官宣:小米在音频理解、音乐生成评估等多AI领域成果入选ICASSP 2026

   时间:2026-01-22 21:10:48 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

小米公司近日对外公布,其研发的多项人工智能技术成果成功入选国际声学、语音与信号处理领域顶级学术会议ICASSP 2026的展示名单。这些成果覆盖音频理解、音乐生成质量评估、通用音频-文本跨模态预训练以及视频内容转音频合成等前沿技术方向,标志着该企业在智能声学领域的技术积累获得国际学术界认可。

据技术团队介绍,此次入选的音频理解技术实现了对复杂声学场景的精准解析,能够从混合音频信号中分离并识别特定声源信息;音乐生成评估体系则构建了多维度的量化评价模型,可对AI生成音乐的艺术性与技术性进行客观评分;跨模态预训练框架通过统一表征学习,显著提升了音频与文本数据的关联处理效率;而视频转音频技术突破了传统方法对画面信息的依赖,仅通过视觉特征即可生成高质量环境音效。

作为全球规模最大的声学信号处理学术会议,ICASSP 2026将于今年5月在西班牙巴塞罗那举行。会议组委会透露,本届收到来自87个国家和地区的超过6000篇投稿,最终录取率不足30%,其中跨模态智能处理领域的竞争尤为激烈。小米此次有四个独立研究项目同时入选,在参会企业中位居前列。

行业分析师指出,随着多模态大模型技术的快速发展,声学信号处理正从单一模态向跨模态融合演进。小米此次展示的技术矩阵,既包含底层算法创新,也涉及应用场景拓展,特别是在环境声学重建和智能内容生成领域形成了差异化优势,或将推动消费电子设备在音频交互体验方面产生变革性突破。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version