阿里近日正式推出其最新研发的万相2.6系列模型,为专业影视制作与图像创作领域带来突破性升级。作为国内首款具备角色扮演能力的视频生成模型,该系列在功能创新上迈出重要一步,不仅支持多镜头切换与音画同步技术,还实现了通过声音驱动角色动作的交互模式。
技术团队介绍称,万相2.6系列针对影视行业复杂场景需求进行深度优化,其多镜头生成功能可自动完成运镜轨迹规划,配合音画同步技术,能精准匹配背景音乐节奏与画面动态变化。角色扮演功能则允许用户通过文本指令设定虚拟角色,模型可自主生成符合人物设定的表情与肢体语言,显著提升内容创作效率。
在应用层面,该模型已开放双重使用渠道:个人创作者可通过万相官方网站直接体验基础功能,而企业用户则能借助阿里云百炼平台调用标准化API接口,实现批量化内容生产。这种分层服务模式既满足个体创作者的探索需求,也为影视制作公司、广告机构等提供工业化解决方案。
据测试数据显示,万相2.6系列在角色一致性保持、场景转换流畅度等核心指标上达到行业领先水平。其声音驱动功能支持中英文双语识别,可解析不同语调特征并转化为对应的面部微表情,为短视频创作、动画制作等领域开辟新的技术路径。









