快手可灵3.0系列AI模型开启超前内测图片视频生成能力全面进阶

时间：2026-01-31 17:06:09 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

快手公司近日宣布，其自主研发的新一代视频生成模型可灵3.0系列已进入超前内测阶段。该系列包含图片3.0、视频3.0及视频3.0 Omni三个子模型，在原有技术基础上实现了多项突破性升级，旨在为影视创作、广告设计等领域提供更专业的生成式AI解决方案。

图片3.0模型的核心升级聚焦于专业创作场景的适配性。通过引入视觉思维链（vCoT）技术，该模型可对输入图像进行结构化解构推理，支持单图或多图批量生成逻辑连贯的系列画面。输出分辨率方面，新增2K与4K选项，满足影视预演、场景设定等高精度需求。针对AI生成内容常见的细节断裂问题，研发团队通过Deep-Stack视觉信息流机制优化了纹理与光影的过渡效果，同时强化了对构图比例、镜头视角等参数的控制精度，使生成画面更符合专业创作规范。

在模型训练环节，快手创新性地采用强化学习框架，结合"真实感"与"电影质感"双重评估体系，通过数百万组专业影视素材的对比学习，显著降低了生成内容的机械感。技术文档显示，该模型在人物面部特征、物体材质等细节还原上已达到行业领先水平，特别在复杂光影场景下的表现力较前代提升40%以上。

视频3.0模型则构建了统一的多模态训练框架，支持文本、图像、视频片段的混合输入。单次生成时长扩展至15秒，并允许用户在3-15秒区间自由调整。智能分镜系统成为最大亮点，该系统可自动解析文本指令中的场景转换需求，智能调度特写、中景、全景等景别切换，配合动态机位调整功能，使生成视频具备专业分镜脚本的叙事逻辑。

针对影视创作中的核心痛点，视频3.0模型在主体一致性控制方面取得突破。通过多图/视频锚定技术，用户可锁定特定角色的面部特征、服装细节或物体形态，确保在复杂运动场景中保持视觉连贯性。音画同步模块新增五国语言及方言支持，采用深度神经网络实现口型与语音的毫秒级匹配，在多人对话场景中可精准区分角色发声，文字生成模块则通过超分辨率技术确保字幕清晰可辨。

作为高端版本，视频3.0 Omni引入视频主体特征库功能，可提取3-8秒视频中的角色形象、动作特征及音色数据，建立可复用的数字资产库。该技术通过特征解耦重组方案，实现形象、声音、动作的分离存储与灵活调用，为影视IP开发、虚拟偶像运营等场景提供技术支撑。音频处理方面，创新性的采样区间调整算法使音色还原度提升至92%，在跨语言内容生成中仍能保持声线特征稳定。

Jay Kim 透露，这套方案的目标是让 AI 解读视觉输入，然后向用户返回有用的信息。结合IT之家此前援引 AndroidAuthority 消息，三星正在研发两款智能眼镜，不带屏幕的款式有望今年上市…

IT之家 3 月 7 日消息，谷歌的 AI 工具 NotebookLM 现已新增“电影化视频概览”（IT之家注：Cinematic Video Overview）功能，可将用户的研究资料和笔记自动生成动态视频…

近日，全国人大代表，小米集团创始人、董事长兼CEO雷军在接受@中国新闻周刊采访时表示，在人工智能时代，或许很多规则将被重写，但同时又会产生很多新的岗位。雷军建议，大家要用开放的心态，迎接更先进的时代。未来…

快科技3月7日消息，近日，全国人大代表，小米集团创始人、董事长兼CEO雷军在接受采访时表示，在人工智能时代，或许很多规则将被重写，但同时又会产生很多新的岗位。雷军认为“未来5年或者10年，一定会有属于机器人…

现实中荣耀MagicV6在折叠屏领域，就像直板机在旗舰领域一样，做到了全面均衡无短板，比如：屏幕、续航、体验等等，有些方面甚至是远远领先行业的。与vivo一样OPPO官方今天也没什么大动作，Find N6…

主打小屏大魔王的一加15T最近预热了不少配置方面的规格，剩下最重要的就是外观了，网传谍照显示似乎是横向大矩阵造型，官方预热下周一会正式公布，在此之前我们注意到一加员工还提前公布了这次的磁吸生态配件新品。如上…

月 7 日消息，苹果 iPhone 17e 手机的跑分现已出现在 Geekbench 数据库中，让外界得以更清楚地了解阉割版 A19芯片的真实表现。作为参考，iPhone 17e 手机搭载的 A19 芯片…

3月份开始，我们发现此前有优惠的手机纷纷收回折扣或者减少折扣，此前无优惠的手机直接上调售价，部分品牌虽然暂未调整售价，但下架了1TB大内存版本，毕竟内存涨价导致大内存版本成本大涨，卖一台亏一台，还不如直接下架…

高通正在尝试构建一种“good-better-best”处理模式，分为良好、更佳、最佳三级，第一级由小型语言模型在终端侧完成回答，第二级是将任务分流到手机、PC或其他独立计算单元进行处理，第三级是将任务上传…

BLE版通过蓝牙连接，超出蓝牙范围时，Tag会向附近支持“查找”功能的设备发送加密蓝牙信号，由设备上传位置至云端，实现远程地图定位。UWB版可以搭配小米17 Pro、17 Pro Max、17 Ultra…

经过我整整3个月的深度测试和对比，终于找到了苹果手机去视频水印的“神仙组合”！ - 刷到超棒的旅行vlog，想保存但角落有硕大的水印 -自己剪视频想用网上的素材，却被水印劝退我表弟上周答辩，PPT里需要插…

但今天，我要告诉你一个天大的好消息：你再也不需要苦苦搜索“苹果快手去水印软件下载”了！今天我，一个实测了市面上无数工具的“去水印狂魔”，将为你吐血整理、激情推荐三款让我跪地叫“爸爸”的微信小程序神器！现在，…

不少机型虽宣称搭载AI功能，却存在交互繁琐、功能单一、实用性不足等问题，联想moto X70 Air Pro作为轻薄影像AI旗舰，凭借全新升级的天禧AI系统，以核心的AI操控、AI播客功能为核心，打造全维智慧…

华为Pura 80虽设计轻薄，却难成拍照画质出色的手机推荐优选：主摄底径偏小，无专业潜望长焦，全焦段拍摄能力薄弱；AI影像优化仅覆盖基础场景，缺乏三重曝光、超级变焦等专业功能，复杂光影、夜景表现差；AI操控…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

快手可灵3.0系列AI模型开启超前内测 图片视频生成能力全面进阶

快手可灵3.0系列AI模型开启超前内测图片视频生成能力全面进阶