百度商业研发团队近期在视频生成技术领域取得了重大进展,于7月2日正式推出了自研的视频生成模型“MuseSteamer”及其配套的创作平台“绘想”。这一创新成果标志着百度在AI视频生成领域迈出了关键一步,特别是针对中文音视频一体化生成方面。
MuseSteamer的核心亮点在于其能够打破传统视频制作的常规流程,实现了画面、音效与人声台词的同步创作。以往的视频生成技术往往遵循“先画面后配音”的模式,而MuseSteamer则能够同步处理这些元素,大大提升了视频创作的效率与流畅度。
在技术层面,MuseSteamer展现了多项突破性的能力。它能够根据一张图片,迅速生成长达10秒、分辨率为1080p的电影级画质视频。视频中的人物微表情与运镜效果均达到了专业影视制作的标准。这些能力的背后,是百度团队对亿级中文多模态数据的深度清洗、精细化视频结构化描述语言的开发,以及多目标强化学习等先进技术的综合应用。
MuseSteamer模型家族涵盖了Turbo、Lite、Pro及全系列有声版等多个版本,旨在满足不同用户群体的需求,从普通创作者到专业影视机构都能找到适合自己的工具。目前,Turbo版已在绘想平台上开启限时免费公测,其他版本也将在8月内陆续向公众开放。