ITBear旗下自媒体矩阵:

百度自研视频生成模型MuseSteamer:中文音视频一体化,图生电影级高清视频

   时间:2025-07-03 03:02:00 来源:上海证券报编辑:快讯团队 IP:北京 发表评论无障碍通道

百度商业研发团队近期在视频生成技术领域取得了重大突破,于7月2日正式推出了名为“MuseSteamer”的自研视频生成模型及其配套的创作平台“绘想”。这一创新技术被标榜为全球首个能够实现中文音视频一体化生成的视频模型,它彻底颠覆了传统AIGC视频制作的流程。

传统视频制作往往遵循“先画面后配音”的模式,而MuseSteamer则通过其先进的技术,实现了画面、音效与人声台词的协同创作,使得视频内容的生成更加流畅与和谐。这一变革不仅提升了视频制作的效率,更为创作者提供了更多元化的创作可能。

MuseSteamer在技术上实现了多项突破。它能够根据一张图片,快速生成长达10秒、分辨率为1080p的电影级画质视频。视频中的人物微表情与运镜效果均达到了专业影视的水准,展现了其强大的生成能力。这一成就的背后,是百度商业研发团队在亿级中文多模态数据清洗、精细化视频结构化描述语言以及多目标强化学习等技术上的深入探索与优化。

为了满足不同创作者的需求,MuseSteamer模型家族推出了多个版本,包括Turbo、Lite、Pro及全系列有声版。这些版本覆盖了从普通创作者到专业影视机构的广泛需求,为各类用户提供了定制化的解决方案。目前,Turbo版已经在绘想平台上开启了限时免费公测,而其余版本也将在8月陆续向用户开放。

百度商业研发团队的这一创新成果,不仅展示了其在视频生成技术领域的领先地位,更为整个视频创作行业带来了新的发展机遇。随着MuseSteamer的推广与应用,我们有理由相信,未来的视频创作将更加多元化、高效化,为观众带来更多精彩纷呈的视觉盛宴。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  RSS订阅  |  开放转载  |  滚动资讯  |  争议稿件处理  |  English Version