滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

百度MuseSteamer视频模型发布：音画同步生成，开启AI创作新纪元

时间：2025-07-03 12:25:59 来源：砍柴网编辑：快讯团队 IP：北京 发表评论无障碍通道

百度在近日举办的AI DAY开放日上，震撼发布了其自研的视频生成模型MuseSteamer，为全球的视频创作者们送上了一份智能化的创作大礼包。这款模型凭借创新技术，致力于满足各类用户的多样化创作需求，推出了Turbo版、Lite版、Pro版及全系列有声版等多种版本。

百度商业体系商业研发总经理刘林在活动中深入介绍了MuseSteamer的核心优势。他强调，MuseSteamer具备出色的指令理解与遵循能力，真正实现了“所思即所得”的创作理念，让创作者们的想象力得以自由驰骋。在一段展示的古装武侠视频中，MuseSteamer不仅生动刻画了侠客与巨型怪物的激烈对战，还通过精妙的镜头语言，如俯拍、仰拍和环绕运镜等，将武侠世界的紧张氛围展现得淋漓尽致。

更令人惊叹的是，MuseSteamer在短片《她总在三点一刻出现》中的表现。这部短片通过10秒的超长镜头和1080P的高清画质，将王家卫式的色彩美学发挥到了极致。从男主角的徘徊张望到女主角喝咖啡的细腻动作，每一个细节都被刻画得栩栩如生。而高清画质更是将咖啡热气、衣物褶皱等微小元素完美呈现，为观众带来了电影级的视觉享受。

MuseSteamer还是全球首个实现中文音视频一体化生成的视频模型。它能够同步生成画面、音效和人物台词，为创作者们提供了更加完整的创作体验。以一段沙漠越野短片为例，MuseSteamer不仅呈现了越野车在沙漠中疾速漂移的震撼画面，还智能生成了与之相匹配的立体声效。发动机的低沉轰鸣、轮胎与沙地的摩擦声等声音元素与画面动作完美融合，让观众仿佛身临其境。

在技术层面，MuseSteamer的成功得益于百度在数据、算法和审美等方面的深厚积累。该模型构建了亿级规模的中文多模态数据库，并通过三级优化体系实现了业界领先的语义对齐精度。在算法架构上，MuseSteamer采用了精细化结构设计，支持中文文本、参考图像等多模态条件输入，确保了画面细节和主体运动轨迹的精准呈现。MuseSteamer还构建了一套完整的有声视频生成能力，实现了视觉信息、高还原度人声与环境音的自动生成。

随着MuseSteamer的发布，百度还推出了全新的AI视频创作平台——“绘想”。这个平台将为创作者们提供更加便捷、高效的视频生成体验。用户只需通过PC端搜索“MuseSteamer”或“绘想”，即可免费体验Turbo版功能，探索AI视频创作的无限魅力。为了激发更多创作者的热情，百度还将在7月2日至8月3日期间举办“绘想·跨次元捏合”AI视频创作大赛。参赛者只需上传一张图片，就能借助MuseSteamer的强大能力生成富有创意的动态视频作品。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

人形机器人安全挑战升级：探索新规范，守护人机共融未来

虽然业界已经认识到，人形机器人需要侧重物理防护与故障缓冲，如在紧急制动时优先保护操作人员，但波士顿动力安全主管费德里科·维森蒂尼（Federico Vicentini）同样强调，如避免碰撞、稳定停机等规则、…

07-03

无刷板：机器人关节驱动的核心，解锁多元应用场景新潜力

在机器人关节驱动场景中，无刷板凭借出色性能成为核心组件。同时，无刷板稳定的驱动性能，能保障机器人在长时间、高强度工作下持续稳定运行，减少故障停机时间。服务机器人场景中，像迎宾机器人、清洁机器人等，对关节运动…

07-03

齐鲁工业大学：10亿科研投入，5个新博士点，育人成果斐然

接受《老徐话高招》采访时，樊士相表示，四年前当他从临沂一座小县城考进齐鲁工业大学，他未曾想过能够站在智能制造的前沿：“学校的课程与企业接驳密切，即使直接就业，也有很强的适应能力。” 作为一所2017年5月刚刚…

07-03

智能环卫机器人“军团”亮相西乡，人机协同共绘城市清洁新图景

酷哇的“军团”，到玉禾田的“哨兵”，不仅仅是西乡街道呈现的“全面覆盖”与“精准补位”相结合的立体化格局，这更像是一个生动的缩影，折射出整个宝安区，乃至深圳，如何以机器人技术为支点，撬动一场改变城市管理模式和…

07-03

阿里通义实验室开源ThinkSound：AI音效师，为视频生成高保真音频

07-03

微信公众号未凉！大V们，是时候醒醒面对现实了

07-03

微软年内再启大规模裁员，9000岗位面临风险

07-03

中国无人机：救援显实力，全球专利市场双领先

《纽约时报》网站报道说，短视频显示，这名被困男子悬挂在无人机上的长绳上，很快就被运送到了安全地带。美国科技网站“无人机在线”也对此进行了报道，称其为“一场未经策划的救援壮举”。此外，英国《金融时报》网站…

07-03

京东物流交通展发布“FAST”战略，引领物流行业绿色转型新篇章

07-03

碳化硅镜片创新：为AR眼镜高效散热开辟新路径

近日，西湖大学和慕德微纳团队发布了题为《用于电子设备散热的高导热透明辐射散热器》的技术文献，提出了一种基于碳化硅的智能眼镜光学镜片，来实现高效的热管理，可使微型投影装置（智能眼镜中的主要发热组件）的表面温度…

07-03

斯坦德机器人港股上市在即，小米智造加持，哈工大校友领航创新征程

07-03

马斯克旗下xAI再获百亿融资，人工智能版图持续扩张

07-03

百度MuseSteamer视频模型上线：音画同步生成，开启AI创作新纪元！

07-03

互联网新闻信息稿源单位名单更新，权威发布平台一网打尽！

07-03

SRv6核心标准RFC9800发布，中国移动牵头制定引领全球互联网技术演进

07-03

点击查看更多 +

全站最新

碳化硅镜片创新应用：为AR眼镜高效散热带来新方案

2024物联网漫游深度解析：破解误区，把握全球化运营战略优势

智慧畜禽养殖：以科技重塑养殖生态，打造高效健康新模式

侵权张艺兴黑粉致歉信公开

暑期研学游升温全国现存研学相关企业超3万家

家庭网络摄像头安全隐患大排查：你的摄像头安全了吗？

热门内容

本栏最新

百度MuseSteamer视频模型发布：音画同步生成，开启AI创作新纪元

人形机器人安全挑战升级：探索新规范，守护人机共融未来

无刷板：机器人关节驱动的核心，解锁多元应用场景新潜力

齐鲁工业大学：10亿科研投入，5个新博士点，育人成果斐然

智能环卫机器人“军团”亮相西乡，人机协同共绘城市清洁新图景

阿里通义实验室开源ThinkSound：AI音效师，为视频生成高保真音频

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.