滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达联合清华等高校突破多智能体建模难题 Gamma-World让“多人世界”仿真更高效真实

时间：2026-05-30 18:01:25 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能领域，多智能体场景下的世界建模长期面临技术瓶颈。传统视频世界模型主要针对单智能体设计，通过输入动作序列预测单一视角的未来画面。然而当场景扩展至多个智能体共享同一演化环境时，模型需要同步处理多个耦合视角的投影，这要求系统在架构层面实现根本性突破。

现有技术方案存在两大核心缺陷：身份编码机制破坏了智能体间的对称性，全连接注意力机制导致计算复杂度随智能体数量呈平方级增长。这些架构缺陷无法通过增加数据规模或模型参数来弥补，成为制约多智能体世界模型发展的关键因素。

由跨国研究团队提出的Gamma-World模型，通过重构底层组件解决了上述难题。该模型在旋转位置编码（RoPE）框架中引入第四维度——玩家轴，采用正单纯形几何结构实现智能体身份编码。这种设计将所有玩家均匀分布在正多边形的顶点上，确保任意两个智能体在表示空间中的几何关系完全等价，从根本上保障了模型的置换对称性。

在跨智能体通信机制方面，研究团队创新性地提出稀疏枢纽注意力结构。通过引入可学习的枢纽令牌（hub token），构建起"智能体-枢纽-智能体"的两级信息传递路径。这种轮辐式拓扑结构将计算复杂度从O(n²)降至O(n)，使模型在处理8人场景时的计算量较全连接方案减少约16倍。实验表明，该设计不仅显著降低算力消耗，更通过显式编码世界状态瓶颈，提升了模型对共享环境变化的建模能力。

为平衡生成质量与推理效率，模型采用三阶段训练策略：首先训练具备完整序列访问权限的双向教师模型，随后训练仅能观察历史帧的因果学生模型，最终通过条件自强迫蒸馏将多步采样压缩为4步。这种渐进式训练方法使模型在保持24帧/秒实时推理速度的同时，将视频生成质量评估指标FVD平均降低40%以上。

在多人Minecraft环境测试中，模型展现出卓越的泛化能力。仅使用双人数据训练的模型，可直接生成四路同步视角画面，且各视角间保持严格的空间一致性。当智能体移出彼此视野时，模型仍能准确追踪共享世界状态，证明其并非简单拼接独立视频流，而是真正理解了环境演化规律。

该框架的通用性在真实机器人场景中得到验证。研究团队将模型应用于双臂机器人协同任务，生成的未来帧精准保持了机械臂的空间布局与运动协同性。这种从虚拟方块世界到真实物理系统的无缝迁移，展示了多智能体世界模型作为新一代数据生产基础设施的潜力。

论文指出，现有模型在处理超过8个智能体时仍面临挑战，未来工作将聚焦于动态枢纽令牌分配机制与分层注意力结构。研究团队已开放模型代码与训练数据集，为工业界探索多智能体系统仿真提供重要参考。

更多>同类资讯

具身智能新赛道：蚂蚁灵波VLA2.0如何解锁机器人“通用大脑”生态位？

07-08

苹果300亿美元携手博通，推动超150亿枚芯片美国本土制造再升级

07-08

艺康收购CoolIT强强联合，以创新液冷方案赋能AI基础设施可持续发展

07-08

2026英伟达杭州站创业企业展示将启，共探AI前沿，享多重福利与机遇

07-08

面壁智能：以端侧大模型为基铺就AI普惠产业新路径

07-08

灵境智源获超亿元融资，经纬创投领投，打造具身智能原生计算新生态

07-08

“伴侣型”人形机器人登场：是情感慰藉新选择，还是暗藏风险需警惕？

07-08

ECI榜单见证前沿AI模型激烈角逐：头部模型领先周期大幅缩短至约7周

IT之家 7 月 8 日消息，科技媒体 The Decoder 昨日（7 月 7 日）发布博文，报道称在 Epoch CapabilitiesIndex（ECI）榜单榜首更迭中，前沿模型只能维持约 7 周领…

07-08

DeepSeek一年前悄然布局自研推理芯片，降低依赖谋求AI硬件自主权

据路透社及多位知情人士透露，中国人工智能初创企业DeepSeek正秘密推进一款自研AI芯片的研发计划。该芯片明确定位于推理阶段，专门面向模型部署和在线回应用户请求的场景，而非用于训练新模型。DeepSeek…

07-08

GPT-5.6系列即将登场：Sol秀实力，Terra或成高频应用新宠？

Sol 是其中的旗舰模型，也是 OpenAI 目前对外描述中最强的一款。换句话说，Terra 才可能是很多用户真正高频接触的GPT-5.6。现在 OpenAI 官宣 GPT-5.6 的发布时间，也让大模型…

07-08

蚂蚁灵波LingBot-VLA 2.0开源：覆盖17大品牌20余构型，赋能具身智能生态

07-08

华为王雷：Token经济前景广阔，但面临效率安全等多重挑战

07-08

稀宇科技MiniMax再发力：计划推出2.7万亿参数大模型，最早三季度开源

07-08

努比亚将推全球首款AI智能体手机，2026世界人工智能大会首秀引期待

07-08

消息称稀宇科技MiniMax计划推出参数规模2.7万亿新一代大模型

07-08

点击查看更多 +

全站最新

宝马M5 Touring谍照来袭！全新外观吸睛，4.4T插混+四驱性能续航双在线

吉利全新中型轿车7月10日首发！直瀑格栅配激光雷达，动力多元油耗低

杜卡迪百周年献礼！首款赛事级滑胎车Desmo450 SM原型车惊喜亮相

东风风神下半年发力！四款新车L8Y、L8+、L9、E80即将登场

华境S：华为系智能加持，大六座SUV市场新宠，交付破万实力见证

汇聚科技（01729.HK）业绩预增超150% 股价强势反弹低位价值凸显引关注

热门内容

本栏最新

瑞为技术7月8日港交所主板挂牌募资超6亿港元领跑民航视觉智能市场

全国主流媒体走进红旗繁荣工厂见证吉林汽车产业智造新飞跃

德州仪器慕尼黑上海电子展亮剑：以系统级方案赋能下一代汽车电子革新

港科大企业家科创学者课程第三模块落幕：硬科技与AI融合，赋能科创未来

荣威家越07大五座SUV来袭：Momenta智驾加持，火山引擎赋能AI新体验

2026普通人学AI新路径：不学编程，四步走打造AI协作实用能力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.