滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

东京理工学院等团队研发DyaDiT：虚拟角色社交互动迈向“真人化”新阶段

时间：2026-02-28 02:58:41 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

东京理工学院联合多所高校的研究团队近日取得一项突破性进展，其开发的DyaDiT技术为虚拟角色赋予了更接近人类社交能力的互动方式。这项创新成果通过分析对话双方的语音、关系类型及性格特征，使数字人能够生成符合情境的肢体语言，彻底改变了传统虚拟角色互动模式单一、缺乏情感共鸣的现状。

在真实社交场景中，人们会通过点头、手势、身体姿态等非语言方式传递信息，这些行为往往与对话内容、双方关系及性格特质紧密相关。例如，外向者可能伴随夸张的手势，而内向者更倾向于用微笑或轻微点头回应；恋人间的互动充满亲密感，陌生人则保持礼貌距离。然而，现有虚拟角色仅能根据自身语音生成固定手势，无法感知对方反应或调整行为模式，导致互动显得机械生硬。

研究团队为攻克这一难题，构建了包含182小时真实双人对话的"无缝交互数据集"。该数据库覆盖朋友、情侣、家人等不同关系类型，以及外向、内向等多元性格组合，为系统训练提供了丰富的样本。通过深度学习这些数据，DyaDiT技术掌握了人类社交的隐性规则，能够根据对话情境动态调整虚拟角色的行为表现。

技术实现层面，系统采用扩散变换器架构，通过逐步细化生成动作序列。其核心创新包括"正交化交叉注意力机制"与"动作词典"：前者可精准分离对话双方的语音信号，避免同时说话时的干扰；后者则将肢体语言拆解为1000种基础动作单元，系统通过组合这些"词汇"构建自然流畅的互动行为。例如，当检测到对方表达困惑时，系统可能选择摊手加皱眉的组合动作；面对积极反馈时，则生成点头配合微笑的反应。

社交关系与性格特征的建模是该技术的另一亮点。系统借鉴心理学"大五人格理论"，将性格维度转化为可量化的参数，使外向者表现为更大胆的手势，内向者呈现更含蓄的肢体语言。同时，通过分析对话中的语气、用词及互动频率，系统能准确判断双方关系，并生成符合情境的亲密程度——恋人间的互动可能包含更多眼神交流与身体接触，而商务洽谈场景则保持专业距离。

实验数据显示，73.9%的用户认为DyaDiT生成的动作"像真人"，69.8%的用户肯定其能准确反映双方关系，66.7%的用户认可性格特征的呈现效果。部分测试者甚至表示，系统优化的动作比原始录像更自然，这得益于算法对冗余抖动的过滤与动作流畅度的提升。消融实验进一步验证了各模块的必要性：移除声音分离模块后，系统在多人对话中的表现下降27%；取消动作词典则使动作多样性减少41%。

这项技术已展现出广泛的应用潜力。在游戏领域，非玩家角色（NPC）可根据玩家行为与关系动态调整反应，增强沉浸感；教育场景中，虚拟教师能通过肢体语言传递鼓励或安抚信号；心理健康服务领域，虚拟治疗师可模拟更人性化的互动模式；远程协作平台则能借助更自然的虚拟化身改善沟通体验。当前系统主要生成上半身动作，未来研究将拓展至面部表情、步态等全身语言，并探索为对话双方同步生成协调互动的技术路径。

对于技术细节感兴趣的读者，可通过论文编号arXiv:2602.23165v1查阅完整研究报告，其中包含架构设计、算法原理及实验数据的详细分析。这项成果不仅推动了人机交互技术的进步，更引发关于"人性化数字世界"的深层思考——当虚拟角色开始理解社交规则、展现个性特质时，人类对自身独特性的认知或许也将面临新的挑战。

更多>同类资讯

93岁记者顾迈男：用一生“挖题”为科学家立传，笔耕不辍照后人

02-28

千帆星座2026年起将在巴西开展商业通信服务助力拉美数字包容发展

02-28

金山办公2025年业绩亮眼：净利润18.43亿，多业务收入稳健增长

02-28

Anthropic 开启赞助计划：为核心贡献者免费提供 6 个月 Claude Max

02-28

社交终局是 AI？Soul 创始人亲自下场：开放核心技术，4700 名大学生在“元创营”重塑 Z 世代社交

02-28

AI监督！外卖“随手拍”上线！淘宝闪购硬核响应新规

02-28

米哈游回应员工离世：无春节加班情况，网传3万抚慰金不实正积极沟通

02-28

太阳能爆闪警示芯片EC240331-022D-5B34：低功耗智能控制，多场景应用新选择

技术创新点主要体现在三个方面：首先是采用新型光电转换算法，将传统光控电路的响应时间从3秒缩短至0.8秒；其次是通过动态功率调节技术，使芯片在2.2V低压状态下仍能维持85%的驱动效率；最后是独创的脉冲序列加…

02-28

工业节能改造优选：空气能热泵头部厂家实力与场景适配深度剖析

工业用户选择空气能热泵厂家时，需重点考量以下因素：1）产品适配性：是否支持高温/低温工况、防腐防爆等特殊需求；2）实力稳定性：生产规模与供货周期能否匹配项目进度；3）服务响应速度：区域服务网点密度与工程师…

02-28

DeepSeek联合顶尖高校发布新论文，DualPath架构破解LLM推理性能瓶颈

02-28

现货黄金站上5250美元

02-28

现货白银站上94美元

02-28

美国前总统克林顿就爱泼斯坦案作证

02-28

美国麻疹疫情持续恶化今年已报告病例至少1136例

02-28

特朗普在最高法院败诉后，面临2000起关税诉讼

02-28

点击查看更多 +

全站最新

广汽2025年成绩斐然：与华为合作、自主品牌发力，迈向高质量发展新征程

亚马逊500亿美元携手OpenAI，共筑AI新生态与定制化模型未来

极狐新阿尔法S5：陈妍希同款时尚座驾，L3智驾或引领出行新潮流

陈妍希米兰闪耀，极狐新阿尔法S5登场，时尚科技共谱生活新篇

尊界S800新激光雷达亮相，以科技革新定义“科技豪华”新范式

极氪8X携G-ASD来袭：以新能源之姿，改写豪华高性能SUV市场格局

热门内容

本栏最新

A股收评：沪指涨0.39%！小金属、电力股掀涨停潮，半导体承压

2月收官！委内瑞拉暴涨82%夺冠，港股科技股“走熊”

始祖鸟ARC'TERYX全新Alpha SL Kit：轻量高效，为阿式攀登者解锁高山探索新体验

2026年2月国产网游审批结果揭晓 146款游戏成功过审获版号

金山办公2025年业绩亮眼：营收净利双增，WPS多业务线齐头并进

佰维存储2025年业绩亮眼：营收112.96亿，归母净利润飙升至8.67亿

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.