阿里巴巴旗下AI应用夸克近日推出全新AI创作平台“造点”,以AI生图与AI生视频双引擎驱动,成为国内首个实现音画同步视频生成的技术平台。该平台率先接入通义万相Wan2.5模型,支持10秒时长、24帧/秒的1080P高清视频输出,其音频生成功能可自动匹配画面内容生成人声、音效及背景音乐,单次生成即可构建完整叙事场景。
在视频生成技术层面,“造点”平台通过模型优化实现了复杂运镜控制能力。创作者可精准调控镜头移动、缩放等动态效果,生成的电影级画面质量已满足影视制作需求。测试数据显示,该平台在人物口型同步、动作连贯性及神态表现上达到行业领先水平,配乐与画面的融合度较传统工具提升40%以上。
图像生成领域,“造点”深度整合Midjourney V7模型核心技术,开发出支持多图参考、风格代码输入及精细化参数调节的创作系统。针对亚洲用户需求,平台特别优化了人像生成算法,在中文文字呈现、传统国风元素渲染等方面形成技术壁垒。电商场景测试表明,商品图生成效率较传统方式提升3倍,平面设计师可快速完成多风格创意输出。
内测阶段,平台涌现出大量现象级作品。其中“中世纪油画大合唱”系列通过AI重构历史场景,实现油画质感与动态人物的完美融合;“文物吃月饼”创意视频则突破静态展示局限,让青铜器、陶瓷等文物以拟人化形态呈现节日场景。专业创作者反馈显示,跨模型协作流程(Midjourney生图+Wan2.5制视频)使单项目制作周期缩短60%,画质稳定性提升显著。
用户体验设计方面,夸克构建了全终端创作生态。PC端提供专业级工作台,支持高清素材处理与复杂指令输入;移动端则主打轻量化操作,开发出“一句话P图”“AI创意视频”等快捷功能。日常修图场景中,滤镜、美颜、去路人等基础功能响应速度达毫秒级,3D手办生成、风格迁移等进阶功能完成度超过90%。
技术团队透露,平台正在开发多语言音频生成模块,未来将支持方言、小语种配音服务。当前用户可通过zaodian.quark.cn或夸克APP“AI生图”入口访问平台,专业创作者与普通用户将获得差异化功能权限。市场分析认为,该平台的音画同步技术可能重塑短视频创作产业链,推动AIGC工具从辅助生产向独立创作演进。