ITBear旗下自媒体矩阵:

生数科技Vidu S1实时交互模型来袭,可语音控走向还能无限时长互动

   时间:2026-07-04 00:57:59 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

生数科技近日正式推出面向实时交互场景的Vidu S1模型,该模型以突破性技术实现视频生成领域的交互革新。通过融合自回归扩散架构,系统摒弃传统一次性生成模式,转而基于历史画面、语音指令及对话上下文进行动态预测,使视频内容能够根据用户实时反馈持续演化。

在交互功能方面,Vidu S1支持全语音控制体系,用户可通过自然语言指令直接操控数字角色的表情、动作及叙事走向。系统突破时长限制,实现无限时连续互动,并兼容真人、动漫、萌宠等多样化初始形象,配合个性化音色定制功能,可快速生成专属交互角色。技术参数显示,该模型默认输出540P(960x540)分辨率视频,帧率达25FPS,最高可扩展至42FPS。

核心技术创新体现在动态响应机制上。当用户发出新指令时,模型会同步分析语音内容与对话历史,在保持叙事连贯性的前提下,实时调整角色行为轨迹。这种设计使视频生成从预设脚本模式转变为动态创作过程,每个交互节点都可能引发新的叙事分支。

目前该模型已启动内测程序,开发者与用户可通过两个渠道体验:线上交互平台(https://www.vidu.cn/vidu-stream)提供完整功能演示,API接入端口(https://platform.vidu.cn/live/landing)则面向技术开发者开放调用。两个测试通道均配备实时反馈系统,用于收集用户行为数据优化模型性能。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version