滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

可灵AI数字人正式登场：极简操作实现高质输出，重塑数字人行业标准

时间：2025-09-19 04:20:11 来源：环球网资讯编辑：快讯团队 IP：北京 发表评论无障碍通道

近日，一款名为可灵AI的数字人产品正式进入公众视野，凭借其精准的口型同步技术、细腻的情绪演绎能力以及跨风格角色生成优势，迅速成为数字人技术领域的标杆产品。用户仅需上传一张角色图片并输入文字或音频，即可生成分辨率达1080p、帧率48FPS的高质量数字人视频，最长支持1分钟时长，覆盖中英日韩等多语种，价格低至每秒0.12元，为广告、电商、教育等行业提供了高效解决方案。

该产品的核心突破在于“极简输入、高质输出”的生成模式。用户既可上传自有素材，也能使用内置的官方形象库、AI生图功能及近百种TTS音色，完成从角色创建到配音的全流程操作。这种“一站式”设计大幅降低了技术门槛，使中小企业和内容创作者无需专业团队即可制作高品质数字人视频。例如，在产品讲解场景中，用户仅需一张商品图片和一段解说词，便能快速生成具有专业表现力的数字人导购视频。

在角色表现力方面，可灵AI展现了深厚的技术积累。实测案例显示，当输入一段英文歌曲音频时，数字人歌手的唇形与歌词音节完美匹配，即使面对快速连读也能保持精准同步。更引人注目的是，通过提示词“眼神专注自信地唱歌”，系统不仅控制了唇部动作，还生成了持麦姿态、微笑互动等细节，完整还原了舞台表演的真实感。这种“神形兼备”的演绎能力，突破了传统数字人仅实现音画同步的局限。

跨风格角色生成是该产品的另一大亮点。依托可灵视频模型的强大泛化能力，系统可处理写实人物、动漫形象甚至动物角色。在卡通猫咪唱英文Rap的案例中，数字人不仅精准捕捉音频节奏，还生成了随节奏摇摆身体的自然动作，赋予虚拟角色鲜活的生命力。这种跨越风格界限的能力，为内容创作提供了更广阔的想象空间。

情绪与动作的精细化控制，进一步提升了数字人的表现深度。在表现“愤怒”情绪的测试中，系统根据提示词“内心全是气愤，非常生气”，生成了紧锁眉头、紧抿嘴唇、眼神压迫感等微表情，将抽象情绪转化为具象视觉语言。这种能力源于多模态理解大模型与视频生成模型的深度融合，使数字人不仅能“听声音”，更能“懂意图”，从而精准规划长视频中的情绪变化、动作设计及运镜逻辑。

技术层面，可灵AI通过交叉注意力机制实现音画高度对齐，结合强化口型的训练策略，确保多语种、歌唱或快速语速场景下的唇形精准度。其关键帧控制架构采用“先构建叙事骨架，再并行生成片段”的方式，在保持角色身份一致的前提下，支持无限长度视频生成。专业评测显示，与行业知名产品Heygen及即梦数字人（Omnihuman-1方案）对比，可灵AI在整体效果及细分维度上均表现优异，GSB得分分别达到1.37和2.39，位居行业前列。

作为全球领先的视频生成大模型，可灵AI自2024年6月发布以来已完成超30次迭代，用户规模突破4500万，生成视频数量超2亿，并为超过2万家企业提供API服务，覆盖影视、游戏、广告等多个领域。此次数字人产品的推出，将进一步推动技术普惠化，助力短视频制作、电商直播、在线教育等场景实现规模化应用。

更多>同类资讯

华为徐直军：未来3年昇腾芯片将快速演进，2027年超节点集群规模达百万卡级

09-19

莫斯科团队研发SRMT技术：共享记忆赋能机器人，开启高效协作新篇章

09-19

小红书“利剑出鞘”：多维治理体系精准打击虚假营销生态

09-19

DeepSeek-R1登《自然》封面：AI大模型迈向科学严谨，融入更广科学交流圈

09-19

七年估值暴涨超70倍！80后博士领航国星宇航，商业航天征途盈利几何？

09-19

寒武纪2025半年业绩会：辟谣百万订单传闻，透露新一代芯片优化进展

09-19

寒武纪业绩会聚焦成长：AI算力需求激增，智能芯片迎发展新机遇

09-19

英伟达50亿美元注资英特尔，黄仁勋陈立武携手共拓AI与PC新未来

09-19

均胜电子新品亮相：AI头部总成、全域控制器等完善机器人产品矩阵

本报讯（记者吴奕萱）9月18日，宁波均胜电子股份有限公司（以下简称“均胜电子”）举行机器人部件新产品发布会，正式公开机器人AI头部总成、基于英伟达Jetson Thor芯片的全域控制器和新一代机器人能源管理…

09-19

中科信息：引入脑机接口技术辅助智慧医疗，完成机器视觉全产业链布局

9月18日晚间，中科信息（300678.SZ）披露投资者活动记录表，称公司目前未开展脑机接口业务，但根据智慧医疗业务的需要，引进脑机接口技术及设备作为辅助工具，研发基于光遗传调控的闭环脑机接口（BMI）系统…

09-19

宇树科技9年砥砺前行，上市在即，机器人赛道或迎新发展浪潮

宇树科技的团队成员们日夜钻研，不断尝试新的技术和设计方案，经过无数次的失败与调整，2017 年，首款四足机器人 Laikago 问世，它的出现，虽然在性能上还有诸多不足，但对于宇树科技来说，却是迈出了坚实的…

09-19

中文互联网基础语料3.0发布：120GB高质量数据助力AI训练与发展

9 月 18 日消息，今日上午，在昆明召开的 2025 年国家网络安全宣传周人工智能安全治理分论坛上，中文互联网基础语料 3.0正式向社会发布。在中央网信办相关部门指导下，中国网络空间安全协会会…

09-19

数联古今智绘文明 2025世界互联网大会文化遗产数字化论坛启幕

开幕式后举行了主论坛，与会嘉宾围绕“保护·传承”“技术·创新”“产业·赋能”“开放·共治”四个议题展开深入讨论，着力探索数字化赋能文化遗产保护的新方法、新路径，推动文明交流互鉴。论坛期间，还举行了文化遗产数…

09-19

华为全联接大会2025发布全球最强算力超节点及集群引领AI基础设施新方向

[中国，上海，2025年9月18日] 今日，华为全联接大会2025在上海启幕，华为副董事长、轮值董事长徐直军发表题为“以开创的超节点互联技术，引领AI基础设施新范式”的主题演讲，正式发布全球最强算力超节点和集…

09-19

华为发布智能世界2035系列报告，揭晓十大技术趋势引领数智未来

华为常务董事汪涛发表了“探索未知，跃见未来”的主题演讲，正式发布智能世界2035系列报告，包括《智能世界2035》和《全球数智化指数2025》报告两大研究成果，展望了未来十年的关键技术趋势以及这些技术对教育、…

09-19

点击查看更多 +

全站最新

李荣浩意外“解锁”新身份，成iOS更新后创意二创灵感源？

苹果或于2025年四季度量产低价MacBook，A系列芯片+多彩设计能否掀起新热潮？

OPPO K13s与K13x正式开售：满级防水抗摔，799元起享超值体验

哈啰跨界Robotaxi，携蚂蚁宁德入局，两年内能否实现万辆规模突围？

大连推进氢燃料电池汽车示范建设：聚焦产业链发展部署关键任务

AI助力混合动力技术升级 “十五五”协同创新开启全能发展新篇章

热门内容

本栏最新

寒武纪2025半年业绩会：辟谣百万订单传闻，透露新一代芯片优化进展

寒武纪业绩会聚焦成长：AI算力需求激增，智能芯片迎发展新机遇

英伟达50亿美元注资英特尔，黄仁勋陈立武携手共拓AI与PC新未来

均胜电子新品亮相：AI头部总成、全域控制器等完善机器人产品矩阵

中科信息：引入脑机接口技术辅助智慧医疗，完成机器视觉全产业链布局

宇树科技9年砥砺前行，上市在即，机器人赛道或迎新发展浪潮

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.