百度视频生成技术迎来重大突破,蒸汽机模型在短短50天内实现全面升级。此次升级不仅大幅提升了模型的技术能力,还带来了更为亲民的价格策略,为视频营销领域注入了新的活力。
蒸汽机模型此次升级的最大亮点在于实现了多人有声视频的一体化生成。以往,视频生成模型往往需要后期配音才能实现声音与画面的同步,而蒸汽机2.0版本则彻底解决了这一问题。现在,模型生成的视频中,人物的声音、表情、动作以及嘴型均能实现完美同步,即使在复杂场景下也能保持稳定表现。视频的画面清晰度和流畅度也得到了显著提升,运镜方式更加丰富多样,为用户带来了更加逼真的视觉体验。
在价格方面,百度此次也展现出了极大的诚意。据百度商业体系商业研发总经理介绍,蒸汽机模型Turbo版生成一段5秒720p的一体化有声视频,仅需1.4元。这一价格远低于行业平均水平,仅为行业普遍价格的70%左右。这一举措无疑将大大降低视频生成技术的使用门槛,吸引更多用户尝试和使用。
值得注意的是,百度蒸汽机模型的更新迭代速度远快于旗下的文心系列大模型。在价格降幅上,蒸汽机模型也表现出了更为激进的态势。据百度副总裁、移动生态商业体系负责人透露,蒸汽机模型从1.0版本到2.0版本的升级,不仅是在需求驱动的基础上进行了技术优化,还更加注重大模型工程方面的优化。这使得模型能够在短短50天内实现技术能力的提升和成本的降低。
蒸汽机模型的主要服务对象为广告主和代理商,旨在满足他们制作视频营销素材的需求。由于模型从立项开始就拥有明确的服务对象,因此在上线一个月的时间内就收集到了诸多客户反馈。大多数广告客户对生成视频的运镜、画质、一致性以及音画一体化提出了更高要求。此次模型升级正是针对这些需求进行了重点改进。
在发布会现场,好莱坞视效指导姚骐还演示了其团队使用蒸汽机模型制作的短片《归途》。该短片通过大模型生成了40多个镜头和120段素材片段,仅用一周时间就制作完成。按照蒸汽机模型的最新定价计算,其制作成本仅为330.6元。这一案例充分展示了蒸汽机模型在降低营销成本方面的巨大潜力。
(由于技术限制,上述图片为模拟展示,实际图片内容可能有所不同)
目前,视频生成模型在营销素材生成等领域的商业价值正在逐步得到验证。以快手为例,其视频生成模型可灵AI在今年第二季度的营收已经达到了2.5亿元,营收能力较几个月前有了显著提升。可以预见,随着技术的不断进步和成本的进一步降低,视频生成模型将在未来发挥更加重要的作用。