滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

生数科技Vidu S1问世：以实时交互能力，开启视频生成全新篇章

时间：2026-07-04 05:33:25 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在近期举办的全球数字经济大会人工智能融合应用发展论坛上，生数科技创始人朱军发表主题演讲，正式推出面向实时交互场景的新一代视频生成模型——Vidu S1。该模型凭借突破性的交互能力，被业界视为推动数字世界与物理世界深度融合的重要技术范式。同期发布的《北京市数字经济标杆企业评价报告》中，生数科技凭借技术创新与产业落地成果入选"新模式新应用标杆企业"。

这款模型的核心突破在于实现视频生成从"单向输出"到"持续对话"的范式转变。传统视频生成需经历"输入指令-等待渲染-播放结果"的离线流程，用户若要调整内容必须重新提交指令。Vidu S1通过自回归扩散架构，将视频生成转化为动态演化的交互过程——模型持续解析语音指令、对话上下文与画面状态，实时生成匹配的后续内容，支持无限时长的连续互动。经实测，即便连续生成数小时，画面仍能保持角色特征稳定、动作衔接自然。

在交互维度上，该模型突破了传统数字人"语音驱动口型"的技术局限。通过深度融合语音语义理解与视觉生成能力，Vidu S1可同步生成与语音匹配的口型、表情、眼神及全身动作。当用户发出"微笑并挥手"的指令时，模型能瞬间解析语义并生成连贯的肢体语言，使数字人从静态展示载体进化为具备情感理解能力的交互主体。技术团队透露，该能力得益于对语音情绪、意图的分层解析机制，配合多模态动作生成算法实现。

角色创建流程的革新是另一大亮点。传统方案需通过多角度素材训练专属模型，制作周期长达数周。Vidu S1采用纯生成式技术路线，用户仅需上传单张图片即可定义角色身份，模型通过分析视觉特征自动生成符合物理规律的动态模型。该技术覆盖真人、动漫、虚拟形象等全品类角色，配合自定义音色功能，实现视觉形象与声音特征的统一建模。测试数据显示，从图片上传到完成角色定义仅需3秒，较传统方案效率提升90%以上。

为保障实时交互的流畅性，研发团队在软硬件协同优化方面取得关键突破。模型侧采用TurboDiffusion推理加速框架，通过少步生成、低比特注意力计算等技术，将单帧生成计算量降低75%，在消费级显卡即可实现540P分辨率、25帧/秒的实时渲染（最高支持42帧/秒）。系统侧开发的TurboServe推理引擎，通过动态资源调度与流式服务优化，确保长时间交互中的画面稳定性。经压力测试，该系统在千人并发场景下仍能保持99.9%的请求响应成功率。

目前Vidu S1已开放内测通道，提供网页端、API接口及移动应用三重体验方式。开发者可通过API将实时交互能力嵌入智能客服、在线教育等场景，企业用户可定制品牌数字人实现7×24小时互动服务，个人创作者则能利用移动端应用快速生成互动短视频。技术文档显示，该模型支持540P至4K的多分辨率输出，帧率可根据硬件性能动态调节，为不同场景提供灵活的技术适配方案。

行业观察者指出，Vidu S1的发布标志着视频生成技术进入"交互优先"的新阶段。当AI不仅能理解指令还能预测需求，数字内容将突破静态展示的边界，成为具备自主进化能力的交互媒介。这种转变正在重塑内容生产、数字营销、远程协作等领域的底层逻辑，为元宇宙、XR等前沿场景提供关键技术支撑。随着实时交互能力的持续进化，数字角色有望从内容载体升级为连接物理世界与数字空间的智能接口。

07-04

聚焦2026产融交流会：机器人商业化突破口在哪？产学研共探新路径

07-04

从雨果预言到AI时代：技术变革下人文精神如何应对新挑战？

07-04

紫光同创首发国产自主产权亿门级FPGA及加速卡填补国内高端芯片空白

IT之家 7 月 3 日消息，新紫光集团旗下紫光同创在 2026 慕尼黑上海电子展上发布 Titan-3 系列亿门级高端FPGA，是国内第一款自主产权亿门级高端 FPGA 产品。 IT之家注：FPGA（现场…

07-04

优必选U1系列机器人订单破万，外观引热议：高度仿生下的期待与争议

与通用人形机器人不同，这些公司更注重为机器人打造接近人类的面孔、皮肤、声音与体温，并训练其情绪交互能力，将其定义为“伙伴”甚至一种“新型关系”。这恰恰揭示了仿生机器人的复杂性：人明知它是一台机器，但面对高度…

07-04

桂海潮：从边陲学子到太空逐梦者，用科研与科普点亮航天新未来

回到地面后，他回到讲台和实验室，组建“太空智能操作技术创新中心”，带领50余名师生开展空间机器人和太空交通研究。他指导6名本科生提出多星协同清除“太空垃圾”方案，获得中国国际大学生创新大赛银奖——这6名学生…

07-04

谐波减速器产业链全解析：A股11家核心企业盈利能力大比拼（附名单）

07-04

AI Agent深度融入业务：零售企业跨越价值陷阱，解锁增长新密码

07-04

iCAR V27大版本OTA升级：HSD V2.0赋能，智驾座舱全面进化

07-04

泰科电子2026慕尼黑上海电子展亮相：多维拓界，携手伙伴共创产业新价值

07-04

泰科电子亮相2026慕尼黑上海电子展：以创新技术引领多领域连接新未来

07-04

美国Weave Robotics推出家庭机器人Isaac 1，能洗衣叠被，2026年秋季发货

07-04

工程师独立开发！DSpark技术成功移植苹果芯片，Mac大模型速度质量双提升

07-04

下一个十年工业互联网蓝图：院士专家前瞻，共话智能体与新型架构新路径

邬院士指出，从发展机遇层面来看，智能体技术将从底层价值、工具架构、产业普惠三个维度重塑工业互联网平台的发展形态。当前，以大模型为代表的新一代人工智能技术快速发展，工业智能正在成为工业互联网创新演进的重要方向…

07-04

从PPT到生产线：2026全球数字经济大会如何让前沿科技扎根现实

2026全球数字经济大会彻底跳出传统论坛走过场、重形式轻实效的固有模式，以真实线下多元场景为核心载体，联动全球政府机构、国际组织、头部科技企业、初创科创团队、产业资本、普通市民全链条产业资源，打通实验室前沿…

07-04

点击查看更多 +

全站最新

浙江男子苦等10个月“熔岩橙”小米YU7 MAX未交付，配色已下架，门店方案遭拒

上汽名爵总经理直播回应抄袭质疑反遭弹幕围攻哽咽离场引热议

新款福特探险者7月6日上市！2.3T配10AT，车长超5米，配置再升级！

2027款福特探险者：标配10AT与四驱，长白山试驾展现美式旗舰实力

吉利银河战舰700内饰官图曝光：AI硬核SUV配悬浮屏与物理按键

领克20三季度上市在即标配800V高压平台与6C补能倍率成亮点

热门内容

本栏最新

iCAR V27大版本OTA升级：HSD V2.0赋能，智驾座舱全面进化

零跑B10新动作来袭！官宣新车色，配置亮点与价格信息一览

一汽丰田2027款格瑞维亚上市携手复星旅文打造家庭出行新体验

优必选“机器人伴侣”引热议：高售价订单火爆，是噱头还是新趋势？

2027款丰田格瑞维亚上市，配置升级二排体验提升，焕新权益价23.68万起

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.