在百度AI DAY科技开放日的盛会上,百度移动生态商业研发团队隆重推出了其自研的视频生成模型MuseSteamer,以及配套的视频产品平台“绘想”。MuseSteamer采用了DIT架构,其参数规模与业界顶尖的视频生成模型相当,能够生成连续10秒的动态视频,并支持最高1080P的高清分辨率。
这一创新之举令人意外,因为就在去年10月,百度CEO李彦宏还曾在内部讲话中表示,由于视频生成模型如Sora的投入周期长,百度并不打算涉足这一领域。然而,仅数月之后,百度便以实际行动打破了这一说法。
在随后的媒体沟通会上,百度副总裁、移动生态商业体系负责人陈一凡解释了百度转变决策的背后原因。他指出,为了满足代理商和广告主对于快速生成广告的需求,百度去年推出了擎舵平台。但在实际应用中,代理商和广告主反馈称,一些科幻场景难以通过实拍实现,希望能借助大模型生成。基于这一反馈,百度移动生态商业体系决定自研视频生成模型。
据一位百度内部人士透露,李彦宏在去年的内部讲话中确实提到,基于多模态需求,可以探索一些相对特定的视频生成场景。此次发布的视频生成模型MuseSteamer,以及此前发布的罗永浩数字人,都是百度在这一方向上持续探索的成果。
与市场上大多数技术驱动型的视频生成模型不同,百度的视频生成模型MuseSteamer采用的是商业驱动模式。即先明确商业需求,再结合需求进行模型研发。这一模式使得MuseSteamer在应用场景上更加明确和具体。
据百度商业体系商业研发总经理刘林介绍,MuseSteamer项目在今年春节后才正式立项,研发团队仅有几十人,但有效的研发时间却仅有3个月。之所以能够如此迅速地推出产品,得益于擎舵平台在多模态生成技术上的积累,以及百度商业体系在模型训练框架推理、卡片调优等方面的技术储备。
此次百度推出的MuseSteamer和“绘想”平台,不仅展示了百度在AI技术上的深厚积累,也体现了其对于市场需求变化的敏锐洞察和快速响应能力。这一创新之举无疑将为广告行业带来新的变革和机遇。