滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

微软发布最新研究预览版模型：VASA-1引领人工智能动画新风潮

时间：2024-04-19 17:23:32 来源：ITBEAR编辑：快讯团队 发表评论无障碍通道

【ITBEAR科技资讯】4月19日消息，微软的最新研究预览版模型虽然暂时只能供微软研究团队使用，但所展示的功能令人印象深刻。这款模型被称为VASA-1，它采用了一种全新的框架，用于创造逼真的说话人脸，特别适用于虚拟人物的动画制作。与之前类似技术相比，VASA-1 在质量和逼真度上似乎有了质的飞跃，能够减少嘴部动作的伪影，与Google研究院最近推出的VLOGGER人工智能模型类似。

据ITBEAR科技资讯了解，VASA-1的工作原理是利用音频驱动动画的方法，可以根据音频内容生成相应的面部表情和动作。微软表示，该模型不仅能够处理面向正面的人像图像，还能应对不同方向拍摄的图像，表现出强大的控制能力，包括眼睛注视的方向、头部距离甚至情绪。

VASA-1的意义在于，它拓展了许多领域的应用可能性。例如，可以用于游戏中的高级唇语同步，提升游戏的沉浸感;也可用于社交媒体视频的虚拟化身创建，以及基于人工智能的电影制作，使人工智能角色看起来更加逼真。

然而，尽管VASA-1展示了出色的效果，微软团队表示，目前这只是一次研究演示，并没有公开发布的计划，也不会提供给开发人员在产品中使用。

该模型令人惊讶的一点是，即使在训练数据集中没有包含音乐内容，它也能完美地对歌曲进行歌词嘴型同步，展示出出色的多功能性。它还能处理不同风格的图像，包括蒙娜丽莎。

虽然微软团队强调VASA-1目前仅用于研究，但人们对它未来的潜在应用充满期待，甚至可能成为未来一些产品的一部分。

标签： 微软

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

美众议院通过法案：严打AI制作非自愿色情内容，守护网络安全

04-30

骁龙8至尊版引领智能革命：手机“超个体”时代已来？

04-30

RWKV7-G11.5B模型重磅发布：多语言推理强手，支持超百种语言！

04-30

Grok 3.5下周开启早鸟测试，xAI能否凭此再掀AI浪潮？

04-30

Lyft上线AI助手，为网约车司机提供个性化收益优化方案

04-30

万兴科技与华为云携手，共创新纪元：AI大模型技术与应用新飞跃

04-30

猿辅导员工猝死事件：公关回应为何引发众怒？

04-30

Meta发布独立AI助手，融入社交新玩法，能否撼动ChatGPT地位？

04-30

京东绿色供应链：科技赋能，政企携手共绘双碳蓝图

04-29

阿里Qwen3系列发布，能否问鼎开源大模型之巅？

04-29

阿里Qwen3登顶全球最强开源模型，性能卓越成本仅DeepSeek-R1三分之一

04-29

腾讯混元大模型研发体系重组，AI投入再加码，新部门成立引关注

04-29

百望股份付英波：数据智能成AI时代企业胜负关键

04-29

腾讯混元大模型体系重组，加码AI研发，推动技术新飞跃

04-29

阿里新一代Qwen3大模型发布：混合推理，快慢思考自如切换

04-29

点击查看更多 +

全站最新

REDMI红米Turbo 4 Pro大揭秘：双环灯带升级，金属中框强在哪？7550mAh电池可登机

苹果新专利：事件相机助力MacBook精准手势识别

马斯克下周发布Grok 3.5，能否准确解答火箭发动机难题？

醉驾报道误植小米汽车画面，深圳新闻网致歉并强化管理

一加13T小屏旗舰：骁龙8至尊版+6260mAh大电池，不到3000元真香？

神舟十九号载人飞船告别空间站，挑战重重下今日终迎回家时刻

热门内容

本栏最新

骁龙8至尊版引领智能革命：手机“超个体”时代已来？

万兴科技与华为云携手，共创新纪元：AI大模型技术与应用新飞跃

猿辅导员工猝死事件：公关回应为何引发众怒？

Meta发布独立AI助手，融入社交新玩法，能否撼动ChatGPT地位？

阿里Qwen3系列发布，能否问鼎开源大模型之巅？

阿里Qwen3登顶全球最强开源模型，性能卓越成本仅DeepSeek-R1三分之一

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.