ITBear旗下自媒体矩阵:

可灵AI视频模型新增音效功能,实现音画同步沉浸式创作体验

   时间:2025-06-28 10:59:55 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道

可灵AI近期在视频创作领域迈出了重要一步,宣布其全系列视频模型新增了“视频音效”功能。这一创新举措意味着,用户在利用可灵AI进行视频创作时,不仅能享受到高清细腻的画面质量,还能体验到与视频内容完美契合、具备深度空间感的立体声音效,从而真正实现了视觉与听觉的双重沉浸。

目前,这一“视频音效”功能已被无缝整合进文生视频、图生视频以及多模态编辑等多种创作模式之中,并且为了庆祝新功能上线,可灵AI决定在限定时间内向所有用户免费开放此功能。

可灵AI还对原有的“音效生成”功能进行了全面升级,新增了“视频生音效”这一实用选项。现在,用户不仅可以通过输入文本快速生成音效,还能直接上传本地视频,或是选择之前在可灵平台上创作的视频作品,一键为那些原本静默的画面添加上与语义相符、节奏一致的音效。这些音效能够自动匹配视频中的动作、环境以及氛围,极大地增强了视频内容的感染力与沉浸效果,同时也有效减轻了创作者在音频后期制作方面的负担。

在实际应用中,可灵AI的音效功能展现出了令人瞩目的表现。例如,在一段展现婴儿欢快笑声的视频中,模型不仅精准还原了婴儿清脆的笑声,还细致捕捉到了婴儿笑声间隙中的短暂吸气声,这些声音与画面中婴儿脸颊的起伏动作完美同步,再加上富有层次感的立体声效果,使得整个画面充满了温馨与活力。

在另一项测试中,面对一段模拟山体滑坡导致巨石撞击汽车的紧张场景,可灵AI自动生成了金属扭曲断裂、石块飞溅以及尘土飞扬等细节音效。这些声音不仅定位准确、层次分明,还极大地增强了灾难场景的视觉冲击力与沉浸感,让观众仿佛身临其境。

据了解,可灵AI之所以能够实现上述功能,得益于其自主研发的多模态视频生音效模型——Kling-Foley。该模型能够根据视频内容以及可选的文本提示,自动生成与视频画面语义相关、时间同步的高质量立体声音频,涵盖音效、背景音乐等多种声音类型。同时,Kling-Foley还支持生成任意时长的音频内容,并具备立体声渲染能力,能够模拟和渲染出具有空间定向的声源效果。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version