阿里近日正式推出新一代万相2.6系列视频生成模型,该模型在专业影视制作与图像创作领域实现全面突破,成为国内首个具备角色扮演功能的视频生成工具。其核心功能涵盖音画同步、多镜头智能生成及声音驱动技术,凭借完整的功能矩阵跻身全球领先行列,目前已通过阿里云百炼平台与万相官网同步开放使用。
相较于9月发布的万相2.5版本,新模型在画质精度、音效还原及指令响应能力上显著提升,单次生成视频时长突破至15秒,创下国内同类产品纪录。创新性的角色扮演功能支持用户通过上传参考视频,提取人物外观、音色特征及动作姿态,结合文本提示词自动生成单人、多人或人与物互动的影视级片段。例如用户上传日常视频并输入科幻题材提示词,系统可自动完成分镜设计、角色演绎与配音,数分钟内产出具备电影级运镜的完整短片。
技术架构层面,万相2.6采用多模态联合建模机制,对输入视频进行时空维度深度解析。通过捕捉主体情绪变化、姿态轨迹及多角度视觉特征,同步提取语速、音调等声学参数,确保生成内容在画面构图、声音表现及叙事节奏上保持高度一致。该模型已实现单人与多人表演场景的无缝切换,在广告设计、短剧制作等商业场景中展现出强大适应性。
针对专业创作需求,模型新增的分镜控制功能可自动将简单提示词转化为多镜头脚本,生成包含完整故事线的叙事视频。通过高层语义理解技术,系统能构建具备叙事张力的镜头段落,在镜头切换过程中维持主体位置、场景布局及环境氛围的统一性。测试显示,在连续提示词输入下,模型可生成广告创意视频,确保商品主体与背景元素在多镜头中保持视觉连贯。
该模型的普及应用正重塑视觉创作生态。个人用户通过万相官网即可体验基础功能,企业客户可通过阿里云百炼API接入专业版服务,千问APP也将于近期上线互动玩法。目前万相模型家族已拓展至10余种创作能力,覆盖文生图、图像编辑、动作生成等全链条,在AI漫剧开发、短视频制作等领域形成规模化应用,日均处理创作请求量突破百万次。
技术团队透露,后续迭代将聚焦于提升长视频生成稳定性与交互式创作体验。通过优化时空建模算法与扩展多语言支持,模型有望在跨国影视制作、虚拟偶像运营等新兴领域开辟更多应用场景。此次升级标志着国内AI视频生成技术正式进入专业化、场景化发展新阶段。









