滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

快手可灵视频O1模型全量登场：统一多模态，开启视频创作新体验

时间：2025-12-03 01:19:39 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

可灵AI近日通过官方公众号正式宣布，其自主研发的全球首款统一多模态视频生成模型——可灵视频O1已面向全体用户开放使用。这一突破性成果标志着视频生成领域进入全新阶段，通过整合多模态交互能力，实现了从单一功能到综合创作的跨越式升级。

据技术白皮书披露，该模型创新性采用生成式架构底座，通过多模态视觉语言（MVL）交互框架，将图像生成、视频创作、文本理解等任务整合至统一输入界面。用户无需切换不同功能模块，仅需在单一对话框中输入混合指令，即可同步完成主体构建、场景渲染与细节优化。例如输入"生成一位穿红色汉服的女子在古风庭院中弹奏古筝的视频，要求镜头从全景推近至特写"，系统可自动解析多维度要求并生成连贯画面。

核心技术创新方面，模型引入的思维链（Chain-of-thought）技术显著提升了内容逻辑性。通过模拟人类推理过程，系统能够理解"雨天打伞"与"地面水渍"的因果关系，或"运动员起跑"与"观众反应"的时间顺序。官方测试数据显示，在复杂场景的事件推演任务中，模型准确率较前代提升67%，尤其在多主体交互场景中展现出更强的语义理解能力。

创作界面同步迎来重大升级，新版本支持通过自然语言对话调整画面参数。用户可实时修改"主体服饰颜色""背景光影效果"等200余项细节，系统将自动生成多版本方案供选择。针对专业创作者，平台还开放了镜头运动控制、帧率调节等高级功能，满足从短视频创作到影视级制作的不同需求。

在主体一致性控制方面，模型通过三维空间建模技术实现了跨镜头稳定表现。即使经历"从远景到特写"或"360度环绕拍摄"等极端视角变化，主体特征仍能保持高度一致。测试案例显示，在连续200帧的复杂运镜中，人物面部特征识别误差率低于0.3%，衣物褶皱、配饰细节等微观元素亦能精准复现。该技术已应用于影视预告片制作、虚拟偶像直播等多个商业化场景。

更多>同类资讯

高端电视对决：小米S Pro Mini LED与创维85A6F Pro，哪款更适合你？

如果您已经是小米智能家居的用户，选择小米电视SProMiniLED将为您的家庭带来更高效的智能控制体验；而如果您更看重内容丰富性和操作便捷性，创维85A6FPro则是一个不错的选择。创维85A6FPro的售价…

01-07

2026B站大年初一联欢会：喜剧互动新体验，多元合作共狂欢

今天分享的是：报告共计：22页哔哩哔哩2026大年初一联欢会与音乐节行业作为当下热门的文化消费场景，在用户需求、内容创新与社交传播驱动下蓬勃发展，成为年轻人文化娱乐与社交互动的重要载体。B站大年初一联欢会…

01-07

从被误解到硬科技领航者，百度正以十年磨剑重写AI新篇章

过去十年，百度在AI上的投入常被戏称为“烧钱的马拉松”，但随着昆仑芯的 IPO 冲刺和萝卜快跑的规模化落地，这场马拉松已经跑进了最后的直线冲刺。如今，英伟达已经登顶全球市值之巅，它向世界昭示了一个真理：硬…

01-07

雷军拆车直播：信息洪流中，真相如何冲破舆论迷雾？

雷军在直播中曾表示，面对外界的质疑，他感到心理压力很大，许多荒唐的谣言令人难以置信。这场直播不仅仅是对汽车的拆解，更是对消费者信任的考验。雷军的做法，试图通过全方位的透明来赢得消费者的信任，但在快节奏的信…

01-07

雷军直播拆车回应谣言：水军尬黑不可取，优化宣传获认可

雷总请来公关部总经理的徐洁云在直播里直接表示这是恶意剪辑的结果，以及有黑水军操纵账号带节奏。这点雷总解释说，用小字更多是为了满足广告法的合规要求，但实际上确实影响了用户体验，接下来会优化宣传物料设计，尽量更直…

01-07

雷军揭秘“丢轮保车”：奔驰首创，小米YU7碰撞测试也用此设计

1月4日，雷军在微博上分享了关于汽车“丢轮保车”技术的见解。他表示，这一技术是豪华车型中成熟的安全设计方案，过去他以为是沃尔沃最早采用，但实际上最早是奔驰。据博主@毒德科技及公开资料，奔驰在1959年的W11…

01-07

百度百科年终盛典推新功能，“繁星计划”携手超10万专家共创百万知识

01-07

春节前夕三大LCD电视面板厂减产停工，一季度供需格局或趋紧

01-07

文远知行Robotaxi GXR全球首搭NVIDIA DRIVE Thor X芯片开启纯无人商业运营新篇

01-07

无纸化办公浪潮下，邦泽创科年入15亿，IPO前美的入股又离场

01-07

天下秀递表港交所：借微博生态与AI技术，领航全球红人经济新征程

01-07

2025机器人企业扎堆赴港IPO：上市进程延缓，多数未盈利面临挑战

01-07

北大长聘副教授董豪履新上纬新材家庭具身智能领域再添科研强援

01-07

2026年百度百科迎20周年：AI赋能推出新功能，开启知识获取新体验

01-07

CES 2026首日：黄仁勋提前亮剑Rubin架构，苏姿丰携OpenAI共探算力新局

01-07

点击查看更多 +

全站最新

猛士汽车以M817万辆下线为起点，开启“登峰行动” 剑指豪华智能越野新高峰

凯旋Tiger950谍照来袭！排量升级加雷达，能否成摩旅新宠？

苏州新势力Kosmera超跑亮相CES 2026：1903马力零百1.8秒引关注

索尼本田联手打造！AFEELA Prototype 2026首发，科技娱乐融合引期待

别克至境第三款中大型SUV曝光！C形灯组配发光标，增程动力或成亮点

蜂巢能源2025年1-11月全球装车量跃升至第九增速领跑彰显强劲实力

热门内容

本栏最新

昊铂S600纯电动版续航超800km 20万级市场或迎高性价比新选择

科大讯飞Nano+蓝牙耳机：职场高效神器，录音降噪转写轻松应对会议！

宝马iX1纯电SUV来袭！双电机四驱+超500Km续航，运动外观很吸睛

2025品牌建设厂家推荐：首屏展现+权威背书，哪些厂家值得企业关注？

“京都闻道阁”年度蜕变：作品量跃升，作者强阵铸就新辉煌

吉利银河M7来袭！低风阻设计+155km纯电续航 2026年一季度迎战竞品

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.