滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

百度自研视频模型MuseSteamer：中文音视频一体化，一图生成电影级有声视频

时间：2025-07-03 06:01:24 来源：上海证券报编辑：快讯团队 IP：北京 发表评论无障碍通道

百度商业研发团队近期宣布了一项重要创新，于7月2日正式推出了名为“MuseSteamer”的自研视频生成模型及其配套的创作平台“绘想”。这一突破性技术被标榜为全球首个能够实现中文音视频一体化生成的视频模型，标志着视频创作流程的一次重大革新。

传统AIGC视频制作往往遵循“先画面后配音”的模式，而MuseSteamer则打破了这一常规，实现了画面、音效与人声台词的协同创作。这一技术的问世，无疑为视频创作者提供了更为便捷和高效的创作工具。

据百度商业研发团队介绍，MuseSteamer在技术上实现了多项突破。它能够根据一张图片，快速生成长达10秒、分辨率为1080p的电影级画质视频。视频中的人物微表情和运镜效果均达到了专业影视水准，这一能力得益于亿级中文多模态数据的清洗、精细化视频结构化描述语言，以及多目标强化学习等技术的优化。

为了满足不同创作者的需求，MuseSteamer模型家族推出了多个版本，包括Turbo、Lite、Pro及全系列有声版。这些版本覆盖了从普通创作者到专业影视机构的广泛需求，为各类用户提供了定制化的解决方案。目前，Turbo版已在绘想平台上开启限时免费公测，而其余版本则计划在8月陆续开放。

MuseSteamer的推出，不仅为视频创作者提供了更为强大的技术支持，也预示着视频创作行业将迎来一次新的变革。随着技术的不断进步和应用场景的不断拓展，MuseSteamer有望成为未来视频创作领域的重要推手。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

百度AI Day：搜索十年大改版，智能框引领全新搜索时代！

07-03

百度搜索大变身！智能框、百看功能革新，打造AI生态新纪元

07-03

百度自研视频生成模型MuseSteamer：中文音视频一体化，图生电影级高清视频

07-03

百度搜索大变身！智能框、百看功能革新，打造AI生态新体验

07-03

百度搜索大变身！智能框、百看功能及AI生态全面升级

07-03

百度搜索大变身！十年最大改版，智能框引领AI搜索新时代

07-03

OpenAI迎战Meta挖角：阿尔特曼力挺使命感，AGI竞赛文化碰撞升级

7月2日消息，据外媒WIRED报道，周一晚间，OpenAI CEO萨姆・阿尔特曼（Sam Altman）在公司内部发表了一份言辞激烈的备忘录痛批Meta的“强盗行径”，称其挖角行为将引发“深刻的文化危…

07-03

高山荔枝“兰香玉”乘无人机出山，低空配送赋能广东荔枝产业

这样一场荔枝的“低空旅行”，由广东省低空经济产业发展有限公司（以下简称“省低空经济公司”）开展，旨在通过低空配送串联运输和销售链条，赋能广东荔枝产业，为“百千万工程”注入新质生产力。省低空经济公司副总经理周培…

07-03

光伏清扫机器人2025白皮书：组件、支架与机器人智能化协同新挑战与方案

人工清扫成本高且无法适应GW级电站，光伏清扫机器人（ARCS）应用广泛，但组件尺寸增大、边框强度降低、跟踪支架技术演进等带来系统匹配新挑战。 - 匹配支架设计：机器人具备自适应扭转功能，桥架多向伸缩防脱，独立…

07-03

猎豹移动品牌市场副总裁韩建琦宣布结束七年职业生涯

07-03

爱分析高峰论坛聚焦AI大模型：探索技术创新与商业应用新蓝海

活动特别邀请到了王府井集团总裁助理、市场与数字运营中心总经理杜涛、广州广交数科信息产业有限公司AI负责人常振廷、数势科技数据智能产品总经理岑润哲、汇付天下集团系统运营总监、汇付云业务总经理郭松、容联云大模型…

07-03

三款APP透视：互联网投资理财风险与应对策略

众橙 APP 线上线下结合环节可能存在资金流转风险；聚象生活 APP 用户生态复杂，或有虚假信息诱导投资风险；绿果 APP专注领域受市场波动影响大，投资易不稳定。总结来看，三款 APP 运营模式虽有差异，…

07-03

马斯克xAI获百亿美元融资，加速建设AI数据中心挑战OpenAI

【综合报道】7月2日消息，据CNBC及多家外媒报道，埃隆·马斯克旗下人工智能公司xAI于7月1日宣布完成总额100亿美元的融资，其中包含50亿美元股权融资与50亿美元债务融资。这笔资金将用于加速建设…

07-03

2025年6月互联网新闻稿源单位名录正式发布

需要特别说明的是，鉴于互联网新闻信息服务单位的服务形式越来越丰富，稿源单位取得互联网新闻信息服务许可的服务形式不定期更新，更新后的名单对呈现形式进行了优化，除中央和国家机关、群团组织等政务发布平台和省级政…

07-03

2025年6月互联网新闻信息稿源单位全览及许可查询指南

互联网新闻信息稿源单位名单仅明确列出稿源单位主体（报纸、期刊、通讯社、广播电台、电视台、互联网站），不再一一展示其公众账号、应用程序、论坛、博客、微博客、即时通信工具、网络直播等具体服务形式。其中，中央和国家…

07-03

点击查看更多 +

全站最新

荣耀Magic V5发布：开启AI智能体手机新篇章，携手阿里等巨头打造生态

MG新能源征途：技术引领跨界融合，品牌年轻化正当时

百度自研视频生成模型MuseSteamer：中文音视频一体化，图生电影级高清视频

百度搜索大变身！智能框、百看功能革新，打造AI生态新体验

百度搜索大变身！智能框、百看功能及AI生态全面升级

百度搜索大变身！十年最大改版，智能框引领AI搜索新时代

热门内容

本栏最新

百度搜索大变身！智能框、百看功能革新，打造AI生态新纪元

百度自研视频生成模型MuseSteamer：中文音视频一体化，图生电影级高清视频

百度搜索大变身！智能框、百看功能革新，打造AI生态新体验

百度搜索大变身！智能框、百看功能及AI生态全面升级

百度搜索大变身！十年最大改版，智能框引领AI搜索新时代

OpenAI迎战Meta挖角：阿尔特曼力挺使命感，AGI竞赛文化碰撞升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.