百度旗下视频生成模型迎来重大技术突破,其自主研发的“蒸汽机(文心专精)”系统首次实现AI长视频实时交互生成功能。通过流式视频技术的创新应用,该系统成功打破传统AI视频生成10秒左右的时长桎梏,支持“无限时长”内容输出,生成效率显著领先国内同类产品。
用户操作流程得到深度优化,仅需上传单张图片并输入文字提示即可启动创作。系统独创的实时预览功能可完整展示模型推理过程,生成过程中用户可随时中断操作,或在任意时间节点修改提示词,对视频剧情走向、画面细节及转场效果进行动态调整。这种交互模式将传统AI视频的“单向输出”转变为“双向共创”,为用户提供“无限画布”般的连续创作体验。
此次技术升级同步推出两大创新功能:可交互数字人与开放世界动态构建系统。数字人支持多模态沉浸式互动,已应用于智能导购、在线教育、情感陪伴等多个场景;开放世界系统则赋予用户完全操控权,可在AI生成的虚拟游戏地图、数字旅游景区及宇宙探索场景中进行自由探索与交互。
自今年5月启动持续迭代计划以来,该模型已陆续实现音视频同步生成、多角色对话生成、移动端适配等关键技术突破。本次长视频实时交互功能的落地,不仅拓展了影视预演、互动娱乐、个性化营销等领域的应用场景,更推动AIGC技术从基础素材生成向深度内容共创平台转型。