滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

腾讯混元推出开源语音数字人模型，让图片人物“活”起来说话唱歌！

时间：2025-05-28 13:30:16 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

腾讯混元近日宣布了一项创新技术突破，正式推出了其自主研发的语音数字人模型——HunyuanVideo-Avatar，并慷慨地决定将此技术开源。这一模型具备高度灵活性，能够支持从头肩到全身的各种景别，同时兼容多种风格、物种以及双人互动场景。

用户现在只需上传一张人物图像和相应的音频文件，HunyuanVideo-Avatar模型便能迅速解析这些信息。它不仅能够识别图像中的人物及其所处环境，还能深入理解音频中的情感色彩。基于这些理解，模型能够使图像中的人物栩栩如生地说话或歌唱，生成的视频中人物的表情自然、唇形与音频完美同步，甚至连全身动作都流畅协调。

据腾讯混元团队介绍，HunyuanVideo-Avatar模型的成功，得益于先进的深度学习算法和大量的训练数据。这使得模型能够准确地捕捉并再现人类语音、面部表情和身体动作之间的微妙关系。用户上传的任何图像和音频，都能在模型的处理下，被赋予新的生命和活力。

HunyuanVideo-Avatar模型还支持多种自定义选项，用户可以根据自己的喜好和需求，调整生成视频的风格、速度和表情强度等参数。这使得该技术不仅适用于娱乐和创意领域，还可为在线教育、远程会议和虚拟现实等应用场景提供强有力的支持。

腾讯混元的这一创新举措，无疑为数字人技术的发展注入了新的活力。随着技术的不断进步和应用的日益广泛，我们有理由相信，未来的数字人将更加智能、更加逼真，为我们的生活带来更多惊喜和便利。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

地瓜机器人A轮融资1亿美元，构建智能机器人端侧计算新生态

05-28

微软Teams新升级：共享屏幕也能畅快聊天互动？

05-28

RTX 5050笔记本显卡规格揭晓：宏碁爆料五种功耗模式及超频能力

05-28

光舟半导体张学礼：AI眼镜产业洗牌中，中国企业将领先全球

05-28

地瓜机器人A轮融资1亿美元，高瓴资本等众机构携手共投新未来

05-28

拼多多财报“爆雷”，激进补贴背后的阳谋何在？

抛开预期差，虽然本季广告收入是小超预期的，但趋势上仍是由上季的 17% 继续下探到了不足 15%，仍反映出拼多多主站的 GMV增速可能在继续放缓，以及其广告变现率在进一步同比走低。由于 Temu 在政策…

05-28

上海世茂建设等遭强制执行，金额高达5.2亿！

05-28

小米财报亮眼：单季营收破千亿，利润超百亿，雷军难关已过？

05-28

酒店投资热浪来袭，一线城市资产成资本追逐新宠？

05-28

小米智造基金投资十风智能，布局集成电路芯片制造领域

05-28

龙云发动机真空版热试车大捷，长程可靠性累计超2000秒！

05-28

台积电呼吁免芯片关税：美投资1650亿美元计划或受影响

05-28

C919商业运营两周年：航线遍布16城，飞行时长超3.6万小时！

05-28

SK 海力士十月量产12Hi HBM4，助力英伟达新GPU问世？

05-28

微软Aurora AI气象模型开源，气象预报与环境监测迎来新变革！

05-28

点击查看更多 +

全站最新

苹果重磅！独立游戏应用来袭，移动游戏生态再升级？

微软Teams新升级：共享屏幕也能畅快聊天互动？

RTX 5050笔记本显卡规格揭晓：宏碁爆料五种功耗模式及超频能力

假冒“腾讯支付”APP现身，你的钱包还安全吗？

小米YU7静态品鉴即将启动，全国92城6月起迎展车亮相

3C配件品牌崛起：倍思、图拉斯等如何从小众走向全球500强？

热门内容

本栏最新

RTX 5050笔记本显卡规格揭晓：宏碁爆料五种功耗模式及超频能力

地瓜机器人A轮融资1亿美元，高瓴资本等众机构携手共投新未来

上海世茂建设等遭强制执行，金额高达5.2亿！

小米财报亮眼：单季营收破千亿，利润超百亿，雷军难关已过？

酒店投资热浪来袭，一线城市资产成资本追逐新宠？

小米智造基金投资十风智能，布局集成电路芯片制造领域

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.