春节将至,当多数行业放缓节奏时,AI领域却持续呈现激烈竞争态势,新模型接连不断涌现。近期,字节跳动推出的新一代视频生成模型Seedance 2.0引发关注,其距离前一代支持音视频联合生成的Seedance 1.5 Pro发布仅过去两个月,便将视频生成朝着“更可控、更连贯、更像真实镜头语言”的方向推进。
当下,AI领域呈现出入口营销与底层模型更新同步推进的局面。一方面,各厂商在AI入口展开激烈营销竞争,争夺用户心智与使用场景;另一方面,底层模型更新速度并未放缓。厂商们深知,仅靠入口包装和营销声量难以维持长期竞争力,模型能力提升才是关键。
Seedance 2.0此次主打参考能力更全面,相较于Seedance 1.5 Pro,对多张图片、多段视频同时参考的支持更强,使用起来更为便捷。并且,加强“参考视频”能力成为行业趋势,像Kimi 2.5等通用大模型也开始强调可参考视频内容生成结果。
为检验Seedance 2.0的实力,记者进行了全面实测。在苹果风格商品宣传测试中,以运动品牌风格的人物模特与运动手表实物产品为素材,上传一支经典的Apple Watch官方宣传片作为参考。在“即梦”平台,无需复杂提示词,按直观提示方式,告知模型参考视频镜头节奏和风格,生成新运动手表广告,并替换主角与商品图。生成15秒视频需消耗近200积分,耗时较长,但成片质量较高,真实感强,模特跑步时的光线、反光等细节处理到位,商品展示准确,画面元素基本无误,仅数字和中文偶尔出现“AI幻觉”,且与上一代相比进步明显。
在“跨风格整合”的财神拜年测试中,以新春财神抱着金元宝的图与美剧风格恶灵骑士角色图为参考素材,设定让财神先出场,恶灵骑士随后冲入画面,再变成财神骑摩托开走,最后闪出“新春快乐”及具体日期的画面。成片中,开头恶灵骑士部分AI感较重,但财神与道具互动、表情变化、动作衔接比以往更流畅,且画面中较大艺术字出错概率较低。
多主体镜头测试中,制作一张五个小动物穿着不同礼服坐在同一条长椅上的图片,要求画面中小动物一起跳舞拜年,镜头逐个扫过并给慢镜头和特写。此测试考验模型镜头理解和主体保持能力,Seedance 2.0在画面质量和整体一致性上表现不错,但反复运行多次才得到满意版本,仍存在角色位置顺序出错问题,不过角色本身和动作表现提升显著。
宇航员与3D LED屏里的猫测试中,以十字路口大型3D LED屏画面(里面有一只尾巴伸出屏幕的猫)与经典宇航员图片为素材,设定宇航员走进十字路口、打开头盔面罩、戴上墨镜、看向猫并愣住,周围街道人来人往。成片整体效果不错,宇航员走进路口时周围行人和车辆动态变化自然,但屏幕里的猫灵动感不足。
多人物INS风剪贴画测试中,要求保留画面中多个男性角色与背景,让他们跳舞互动。此任务难度较大,以往静态生成就易出错,视频中让人物动起来更易混乱。但Seedance 2.0生成的视频与提示词契合度高,画面文字未改动,七个角色互动且节奏一致,细节处理到位。
NIKE风运动员剪影测试中,以一位体操运动员运动时的模糊剪影及5张有动态拖影的参考图为素材,要求保留动态拖影感觉,风格偏向运动广告片并简单配字。成片在结构和节奏上有主动安排,镜头切换自然,音乐与视频节奏合拍,还会主动给慢镜头特写,且为衔接前后镜头会对参考画面进行内容补充和动作延长。
Seedance 2.0在叙事节奏、镜头切换以及对参考图片和视频的一致性保持上,较上一代有明显提升,但在处理画面中细小文字和元素动态变化时仍会偶尔出错,且单个视频生成时间长、积分消耗大。目前,字节已将该模型全面应用到旗下“即梦”、CapCut(剪映)等AI内容创作平台,这有助于提升内容供给效率。随着视频生成模型快速进入产品化和商业化验证期,谁能平衡好生成质量、速度、可控性和接入成本,谁就更有可能融入真实内容生产链路,春节前这一波密集发布也预示着AI视频模型领域竞争将愈发激烈。









