ITBear旗下自媒体矩阵:

百度“蒸汽机”重大升级:AI长视频实时交互生成,开启AIGC内容共创新纪元

   时间:2025-10-15 19:57:24 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

百度旗下视频生成模型“蒸汽机”近日完成关键技术升级,首次在行业内实现AI长视频实时交互生成功能。该模型突破传统AI视频10秒左右的时长限制,通过流式视频技术革新,将内容生成模式从单向输出转变为双向共创,重新构建了AIGC内容创作的技术框架。

核心技术层面,升级后的模型采用流式生成架构与动态缓冲区管理机制,结合帧级噪声独立控制与历史参考帧优化算法,理论上可支持无限时长的视频生成。在画面连贯性测试中,西部牛仔风格视频的复杂运镜场景(如人物行走、镜头摇移)实现了单镜头无缝衔接,较传统首尾帧续写技术的流畅度提升显著。生成效率方面,经过工程优化的模型推理速度超越国内同类产品,较Vidu 2.0等模型“10秒生成4秒视频”的效率实现指数级突破。

交互体验革新是此次升级的核心亮点。用户仅需上传单张图片与基础提示词即可启动生成流程,过程中可随时暂停并修改提示词,实时调整视频剧情走向、画面风格及转场效果。例如在赛车动画生成场景中,用户可通过修改提示词实现赛车顺序调整、背景切换等动态操作,全程无需重新渲染。这种“无限画布”创作模式,使AI视频工具从被动素材生成器升级为实时协作的创意伙伴。

同步推出的两大创新功能进一步拓展应用场景:其一为可交互数字人,具备双向互动与情感识别能力,可应用于AI导购、教育陪伴等领域。在导购场景中,数字人能根据用户提问实时调整产品演示逻辑;其二为开放世界动态构建系统,允许用户在AI生成的游戏地图、虚拟旅游景点等环境中自由探索,场景细节随交互行为实时渲染,解决了传统预生成内容僵化的问题。

自今年5月启动迭代以来,“蒸汽机”模型已陆续实现音视频一体化生成、多人对话生成、移动端适配等功能。此次长视频实时交互能力的突破,将AI视频的应用场景从影视预演、互动娱乐延伸至个性化营销等领域,推动AIGC技术向内容共创平台演进。百度商业研发团队负责人指出,长时一致性与实时交互技术的融合,标志着AI内容生产从素材生成向协同创作的范式转变。

行业观察人士认为,该技术将加速AI视频在虚拟社交、沉浸式娱乐等领域的商业化落地,通过降低创作门槛激发用户创意潜能,为内容产业注入新的发展动能。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version