阿里巴巴旗下智能搜索应用夸克近日推出全新AI创作平台“造点”,标志着国内首个支持音画同步视频生成的AI创作工具正式上线。该平台整合了AI图像生成与AI视频生成两大核心功能,通过接入通义万相Wan2.5模型,实现了从单帧画面到完整剧情视频的跨越式发展。
技术层面,“造点”平台实现了三项关键突破:其一,依托通义万相Wan2.5的升级能力,支持单次生成10秒时长、24帧/秒的1080P高清视频,画面质量达到电影级标准;其二,创新开发音画同步功能,可自动生成与画面匹配的人声、音效及背景音乐,使视频内容呈现更完整的叙事逻辑;其三,通过强化指令遵循能力,实现镜头运动、场景转换等复杂视觉效果的精准控制。在图像生成方面,平台引入国际领先的Midjourney V7模型,结合夸克自主研发的优化算法,为用户提供高质量的静态图像创作支持。
内测阶段的数据显示,该平台已吸引超过万名专业AIGC创作者参与体验。期间涌现出多部现象级作品,如“中世纪油画大合唱”通过古典绘画风格与现代音乐融合,“文物吃月饼”将历史文物拟人化呈现,“巨物猫咪去旅行”则创造超现实主义视觉奇观。这些作品普遍具备人物口型精准同步、动作自然流畅、配乐氛围契合等特征。参与测试的创作者反馈称,平台将Midjourney的图像生成能力与Wan2.5的视频生成技术无缝衔接,特别是音频视频同步输出功能,使创作效率提升近60%。
用户可通过两种方式体验“造点”平台:PC端用户访问zaodian.quark.cn或通过夸克浏览器“AI生图”入口进入,可调用完整版创作工具;移动端用户通过夸克APP,可体验“一句话P图”“AI创意视频”等轻量化功能。平台设计团队表示,未来将持续优化多模态交互体验,逐步开放更长时长视频生成、多镜头剪辑等进阶功能。