滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Vidu Q2月底登场：参考生功能升级，与Sora 2正面交锋展实力

时间：2025-10-11 03:39:00 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

国庆假期期间，视频生成领域迎来新一轮技术热潮，各大科技公司纷纷推出创新产品，推动行业进入全新发展阶段。OpenAI率先发布旗舰视频生成模型Sora 2，并同步推出Sora应用程序，其"Cameo（引用角色功能）"在上线首周下载量便超越ChatGPT，引发市场广泛关注。紧随其后，马斯克旗下xAI推出Imagine v0.9，以20秒内快速生成视频且全用户免费开放的特点作出回应。国内AI视频创业公司生数科技也宣布，其Vidu Q2参考生功能将于本月底正式亮相，为行业注入新的活力。

在这场技术竞赛中，"引用角色形象"成为视频生成领域的关键突破方向。Sora应用的Cameo功能和Vidu的参考生功能，均通过支持上传参考图生成视频的方式，有效解决了视频生成中的情节割裂、角色行为矛盾等问题。这种技术路径不仅提升了视频生成的可控性，还为创作者提供了更高的自由度。

作为全球"参考生视频"概念的首创者，生数科技早在2024年9月便推出了Vidu的参考生视频功能。随着Sora应用程序的落地，中美在AI视频领域的技术与产品竞争正式进入白热化阶段。Vidu Q2参考生视频功能的推出，不仅降低了普通用户的使用门槛，还满足了专业创作者及广告电商、影视动漫等To B领域对一致性、精准性和性价比的高要求。

当前，视频生成技术仍面临诸多挑战。相较于文字和图像生成，视频生成需要处理连续画面中的叙事完整性，时长增加时易出现情节断裂、角色行为不一致等问题。模型的理解能力和记忆能力限制，以及普通用户难以准确使用专业术语的痛点，进一步加剧了视频生成的可控性难题。引用角色形象的技术思路，成为解决这些问题的有效路径。

Sora App中的Cameo功能允许用户通过简短视频和音频录制，将自己或授权他人带入生成的场景中，实现角色参考。而Vidu的"参考生"功能则覆盖角色、环境、道具等更多要素，为创作者提供更高的自由度和控制力。例如，Vidu Q2支持上传最多7张照片，包括人物、物体、场景等不同组合，并在保持参考图特征的同时，更贴近用户原始输入。

在实际效果对比中，Vidu Q2参考生功能展现出显著优势。以介绍皇冠的提示词为例，Sora 2生成的视频中皇冠样式发生改变，甚至出现凭空漂浮的反常理画面；而Vidu Q2生成的视频中，主体人物始终手握皇冠，人物形象、皇冠样式及麦克风位置保持一致，眼神随皇冠移动而变化，增强了互动感。尽管Vidu Q2未生成音频，但其在主体一致性上的表现更为突出。

在另一个案例中，提示词要求"女孩闭上眼睛，身后的云朵飞舞，发出金光"。Sora 2生成的人脸与参考图差异较大，而Vidu Q2则更好地保持了与参考图人物的一致性。这些对比表明，Vidu参考生功能突破了单一角色引用的局限，实现了角色、道具、场景、特效等全要素参考，同时在主体一致性上保持领先。

据悉，Vidu Q2模型的升级将AI视频生成推向新阶段，其参考生功能在原有基础上实现了质的突破。升级后的版本在视频一致性上保持全球领先，生成速度更快，价格更优惠，且对国内用户更加友好。内测体验显示，Vidu Q2在广告电商、知识科普、宠物拟人化剧情等多个场景中均表现出色，能够满足镜头角度转换、人物动作变化等需求，生成速度仅需十几秒即可完成5秒视频片段。

例如，在广告电商类案例中，Vidu Q2成功复现了美妆博主眼睛上的亮片、使用的美妆蛋及卧室梳妆台等细节，人物运动和镜头切换时未出现变形。在知识科普类案例中，皮革纹理、工具摆放位置保持不变，镜头切换精准。在宠物拟人化剧情案例中，客厅背景、道具位置及柯基帽子均与参考图一致，镜头运镜符合提示词要求。这些案例充分展示了Vidu Q2参考生功能的实用性和创新性。

随着Vidu Q2参考生视频功能的发布倒计时开启，其将用实际表现证明中国视频大模型的技术实力和落地价值。这场视频生成竞赛不仅推动了技术的进步，也为创作者提供了更高效的工具，助力视频生成领域迈向新的发展高度。

更多>同类资讯

AI生成内容版权归属引热议：专家解析三种可获版权情形

10-11

南洋理工FastMesh：革新3D建模技术，让3D内容创作更高效更轻松

10-11

两部门联合发文：为政务领域AI大模型应用划定规范路径

10-11

AI赋能制造业：产品力重塑、品牌力跃升与精益运营新突破

10-11

隐退四年张一鸣现身聚焦AI，互联网大佬集体回归共赴新战场

10-11

神州控股科捷“小金”Agent亮相，以双轮驱动重塑供应链行业新格局

10-11

同名ETF深度剖析：人工智能与大数据ETF，跟踪指数差异几何？

此前，我们已经分多期对比了多个同名ETF以及它们背后跟踪的指数，本期再来对比两个同名ETF：人工智能ETF和大数据ETF。再从过往收益方面来看，在近一年，两个指数的收益均超过40%，中证云计算与大数据主题指…

10-11

马斯克xAI获200亿美元融资，英伟达转型“AI银行”，硅谷算力争夺战白热化

值得注意的是，英伟达还将作为股权投资者深度参与此轮融资，投资额最高达20亿美元（约合人民币143亿元），意味着芯片巨头与AI独角兽的合作进入了新阶段。同为科技巨头的Meta也在财报中透露，将在2025年投…

10-11

马斯克xAI融资200亿美元建超级数据中心，AI算力争夺战再掀高潮

据马斯克近日透露，Colossus2将至少搭载55万块英伟达芯片（GB200，少量GB300），未来还将扩至100万块芯片，整体投资或高达数百亿美元。作为xAI的劲敌，OpenAI在本周也宣布了与另一芯…

10-11

AI应用侧渐趋成熟，人工智能ETF获超3亿份净申购，规模居首

人工智能板块今日回调，截至收盘，中证人工智能主题指数下跌4.8%，上证科创板人工智能指数下跌6.0%，人工智能ETF（159819）全天获超3亿份净申购。Wind数据显示，该产品最新规模超250亿元，位居同标…

10-11

聚焦未来科技教育，「猿编程」独家冠名GET2025引领青少年AI教育新范式

GET2025教育科技大会将于11月在北京举办，大会主题为「教育有AI，学习无界」。「猿编程」作为独家冠名伙伴，将亮相GET2025。时间：11月17-18日会场：北京新云南皇冠假日酒店展位号：C08-C…

10-11

张一鸣借AI人才“过拟合”论道字节跳动以创新人才破局AI发展困局

在这场被业界笑称为“字节跳动人才战略2.0”的活动上，张一鸣与上海交通大学ACM班（计算机科学班）创始人俞勇联手推出民办非营利机构“上海徐汇知春创新中心”，计划招聘对泛计算机和人工智能感兴趣的年轻人，培育新…

10-11

杭州安恒信息率先破局：全球首个AI安服数字员工开启安全服务新纪元

10-11

张一鸣罕见公开亮相！上海徐汇知春创新中心开业，聚焦AI人才创新培养

近日，字节跳动创始人张一鸣突然现身上海徐汇知春创新中心开业现场，这是他近年罕见的公开亮相。张一鸣和上海交通大学ACM班创始人俞勇教授联手发起了这个创新中心。他还说，创新路上要敢于试错，保持平常心，别怕失败…

10-11

张一鸣近年首度公开亮相，谈创新中心人才培养，积极参与字节AI战略

IT之家 10 月 10 日消息，据《科创板日报》今日报道，上海徐汇知春创新中心今日正式开业，该创新中心由字节跳动创始人张一鸣、上海交通大学ACM 班创始人俞勇教授共同发起。作为民办非营利性机构，中心计划招…

10-11

点击查看更多 +

全站最新

极氪科技集团CBO关海涛正式离职朋友圈发文回顾经历并感谢战友朋友

安兔兔9月榜单揭晓：小米17系列登顶高端性价比之巅，多价位段夺冠，华为未入榜

小米17标准版销量遇冷，雷军力荐：小屏长续航，双11或迎降价良机

安卓阵营迈入2TB存储新阶段：小米17 Ultra或率先登场，对标iPhone 17 Pro Max

小米15 Ultra全版本直降500元！影像旗舰5999元起售配置超能打

荣耀Magic8 Pro强势登场！骁龙8E Gen5加持，拍照跑分皆猛，能否比肩小米17？

热门内容

本栏最新

截至2025年10月9日北京市新增3款生成式AI服务累计备案达161款

清华物理才子姚顺宇告别Anthropic，携所学投身谷歌DeepMind开启新征程

占地1300平方米！智元机器人全国首家具身智能体验中心落地无锡

第22届东博会AI元素亮眼：数字智能体引路机器人炫技展风采

AI云竞争下半场：华为以超节点、企业Agent等破局，谁能领跑产业？

2025网安周：每日互动刘宇谈AI时代，知识安全成关键，共筑数字新未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.