滚动资讯

当前位置：首页 > 资讯 > 商业消费 > 正文内容

可灵3.0多模态全家桶来袭！智能分镜+人物一致，AI导演拜年大片嗨翻天

时间：2026-02-07 22:24:53 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

AI视频生成领域迎来新一轮技术升级，某平台推出的可灵3.0多模态系统引发行业关注。该系统通过智能分镜、主体一致性优化等核心功能，显著降低了多镜头视频创作门槛，普通用户也能快速生成具备专业质感的动态内容。

在智能分镜功能测试中，系统展现出强大的文本解析能力。用户输入包含复杂场景转换的提示词后，AI可自动拆解出多个独立镜头，并精准匹配角色动作与台词。例如在模拟《甄嬛传》宫斗场景时，系统不仅完整还原了四个镜头切换，还通过语音合成技术实现了角色对话的声画同步，仅在背景音乐生成环节出现轻微偏差。

角色一致性控制方面，新引入的多图参考机制有效解决了传统模型易出现的"换脸"问题。测试人员上传人物不同角度照片后，系统在奔跑、转身等动态场景中，仍能保持面部特征与体型比例的稳定性。不过当参考图缺乏正面形象时，模型会自主进行特征补全，导致部分测试中出现肤色、发型等细节变化。

文字保真技术成为本次升级的亮点。在动态镜头测试中，旋转的香水瓶身文字始终保持清晰可辨，证明系统已掌握空间变换下的结构渲染能力。这项突破为电商广告制作提供了新工具，商家可直接生成包含产品LOGO的动态宣传片，无需后期人工修图。

方言语音合成功能呈现差异化表现。系统虽支持多语种及地方口音生成，但在复杂语境下仍需优化。测试中让虚拟角色用天津话介绍煎饼果子的场景，最终输出为标准普通话；而兵马俑说四川话的测试则获得较好效果，显示模型对特定方言的掌握程度存在差异。

同步推出的O3 OMNI模型进一步拓展创作边界。该模型支持15秒中长视频生成，可通过3-8秒参考视频提取角色特征，实现外观、声音的双重绑定。在万圣节主题测试中，系统准确控制兔子跳跃轨迹，使其依次穿过南瓜灯、墓碑等元素，展现出对时序关系的精确把控。

分镜叙事功能提供智能与自定义双模式。智能模式允许用户直接输入完整脚本，由AI自动完成镜头设计；自定义模式则面向专业创作者，支持上传参考图并标注每个镜头的运动轨迹。不过测试显示，自定义模式对提示词精度要求较高，普通用户更倾向使用智能生成方案。

当前该系统已向黑金会员开放Web端体验，普通用户预计将在短期内获得使用权限。技术团队承认现有模型仍存在角色融合度不足、自定义分镜操作复杂等问题，但强调这些缺陷不影响基础创作需求，后续版本将持续优化交互体验与生成质量。

更多>同类资讯

索尼为WF-1000XM6耳机上架素皮保护套，黑灰双色满足高端用户需求

04-29

一加Buds Ace 3耳机来袭：55dB降噪 54小时续航游戏翻译全搞定

04-29

交个朋友发布2025年报：营收15.48亿，净利润1.16亿元

04-29

理想汽车进入阿联酋/沙特阿拉伯市场，同步启动亚太区域布局

04-29

七匹狼梧林大秀：以文化为帆，引领中国男装破局与全球归航之路

04-29

长城魏建军“契约”直播：以行动诠释承诺，展中国汽车产业担当

04-29

北京车展新景象：核心供应商登台，汽车产业开启“车链”竞合新时代

04-29

比亚迪汉EV闪充版17.98万起上市：超快充与长续航，重塑纯电轿车体验

04-29

比亚迪一季报利润大跌：短期承压，电动化龙头能否逆势突围？

04-29

北京车展奥迪E7X零重力座椅成焦点，舒适体验获家庭用户青睐

04-29

对话smart高层：以品牌DNA破局市场，未来拓展与销量增长双轨并行

04-29

油价攀升助力丰田纯电动汽车热销，3月销量增139%一季度翻倍

04-29

东鹏“0糖”商标引热议，食品行业“心机商标”乱象待整治

04-28

贵州茅台：穿越业绩低谷开启高端叙事新征程

04-28

猪价大跳水，餐厅价格却坚挺？拼好饭15元辣椒炒肉成打工人福音

04-28

点击查看更多 +

全站最新

商汤科技发布SenseNova U1系列模型开启原生统一多模态智能新篇章

六家科创企业齐聚DIA创新孵化行动发布前沿命题激发创新活力

Ninebot小米九号卡丁车PRO2代：速度激情与安全操控的完美融合体验

0电量增程SUV勇闯纽北赛道，大众ID. ERA 9X实力验证增程不“疲软”

北京车展“链”动未来：京津冀携手共筑智能网联汽车产业新生态

小米汽车北京车展火力全开！YU7 GT 5月底登场，Vision GT概念车首秀引关注

热门内容

本栏最新

比亚迪汉EV闪充版17.98万起上市：超快充与长续航，重塑纯电轿车体验

北京车展奥迪E7X零重力座椅成焦点，舒适体验获家庭用户青睐

对话smart高层：以品牌DNA破局市场，未来拓展与销量增长双轨并行

恒鑫生活：瑞幸等品牌背后的“卖铲人”，巨头地位能否稳立？

外资车价格战失效销量下滑，国产电车凭成本优势再度主导国内市场

瑞声科技高端访谈：以全链路能力，共绘智能座舱感知新蓝图

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.