ITBear旗下自媒体矩阵:

快手可灵3.0系列AI模型超前内测:图片视频双升级,多模态创作新体验

   时间:2026-01-31 15:37:58 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

快手科技近日宣布,其自主研发的新一代视频生成模型可灵3.0系列正式进入超前内测阶段。该系列包含图片3.0、视频3.0及视频3.0 Omni三大版本,在原有技术架构基础上实现了多项关键突破,为影视制作、广告创意等领域提供更专业的AI生成工具。

图片3.0版本聚焦专业创作场景,推出四大核心升级:首次支持通过单张或多张参考图生成逻辑连贯的系列画面,输出分辨率提升至2K/4K级别,满足影视预演、场景设计等高精度需求;通过改进纹理渲染与光影算法,显著降低AI生成痕迹;优化构图控制模块,使镜头语言更符合专业影视规范。技术团队采用视觉思维链(vCoT)技术实现场景解构推理,配合Deep-Stack视觉信息流机制,在模型训练中引入强化学习框架,结合真实感与电影质感双重评估标准优化输出效果。

视频3.0版本构建了统一的多模态训练框架,支持文本、图像、视频片段混合输入,单次生成时长扩展至15秒并支持3-15秒灵活调整。新开发的智能分镜系统可自动匹配景别变化与机位调度,通过多图/视频锚定技术强化主体一致性控制。在音频处理方面,实现中、英、日、韩、西五种语言及方言的精准口型同步,支持多人场景下的角色定向发声,招牌文字等细节的清晰度提升30%以上。

作为高端版本,视频3.0 Omni创新性地引入视频主体特征库功能,可提取3-8秒视频中的角色形象与音色进行数字化重建。该版本通过优化多模态指令解析架构、调整音频采样区间及特征解耦重组方案,在保持生成效率的同时,使虚拟角色的表情动作与语音匹配度达到影视级标准,为短视频创作、虚拟制片等领域开辟新的应用场景。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version