字节跳动旗下Seed团队近日宣布,其自主研发的新一代音视频创作模型Seedance 1.5 pro已正式上线。该模型突破传统创作边界,首次实现音视频内容的联合生成能力,为内容创作者提供更高效的工具支持。
Seedance 1.5 pro的核心突破在于多模态任务处理能力。通过深度融合音频与视频生成技术,该模型可同时处理文本、图像与声音的交互关系。例如,用户输入一段文字描述后,系统不仅能生成对应的视频画面,还能自动匹配符合场景的背景音乐与音效;若提供静态图像作为引导,模型则能基于图像元素扩展出动态视频内容。
技术层面,该模型采用分层架构设计,将语义理解、视觉渲染与音频合成模块进行解耦训练,再通过联合优化实现跨模态对齐。这种设计既保证了各模块的专业性,又提升了多任务协同效率。测试数据显示,在相同硬件条件下,Seedance 1.5 pro的生成速度较前代提升40%,同时支持更高分辨率的视频输出。
目前,该模型已开放基础功能测试,创作者可通过指定平台体验文本到音视频的完整创作流程。团队透露,后续版本将增加实时交互功能,允许用户在生成过程中动态调整参数,进一步降低专业音视频内容的制作门槛。





