滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

通义千问团队推出Qwen-AgentWorld：原生语言世界模型引领智能体交互新突破

时间：2026-06-24 16:09:22 来源：天脉网编辑：快讯 IP：北京 发表评论无障碍通道

阿里通义千问团队近日宣布推出全球首个原生语言世界模型Qwen-AgentWorld，该模型通过模拟七大领域智能体交互环境，在AgentWorldBench评测中展现出超越GPT-5.4、Claude Opus 4.8等主流模型的性能。这一突破标志着语言模型从单一文本生成向复杂环境交互的范式转变，为智能体训练提供了全新路径。

该模型覆盖文本类（MCP、搜索、终端、软件工程）与GUI类（网页、操作系统、安卓应用）七大交互场景，通过可渲染代码替代传统像素帧实现环境观测。这种设计使纯文本建模即可解析视觉信息，显著降低计算资源消耗的同时，支持跨领域知识迁移。例如，在终端和软件工程领域，模型展现出比GPT-5.4更强的状态预测能力，3970亿参数版本在评测中取得58.71分的综合成绩。

训练架构创新是该模型的核心优势。团队构建了CPT→SFT→RL三阶段训练体系：在继续预训练阶段注入环境知识，通过信息论损失掩码精准识别关键对话轮次；监督微调阶段激活思维链推理模式，强化下一状态预测能力；强化学习阶段采用混合奖励信号优化输出质量。这种端到端设计使环境建模成为原生训练目标，而非对通用大模型的后期适配。实验数据显示，350亿参数版本经三阶段训练后，综合得分提升8.66分，性能超越Claude Sonnet 4.6。

同步开源的AgentWorldBench评测基准包含七大领域真实环境执行数据，每条测试样本均配备ground-truth观测值。该基准不仅验证了模型在复杂交互场景中的优势，还揭示了世界建模的双重应用价值：作为解耦环境模拟器时，可为强化学习提供可控训练环境，其可控模拟RL方法在行为塑造效率上显著优于纯真实环境训练；作为统一智能体基座模型时，预热训练后的模型可直接迁移至多轮任务，无需额外微调即可保持性能。

目前，Qwen-AgentWorld模型及评测基准已在Hugging Face和ModelScope平台开放下载。这项研究为智能体训练提供了从环境建模到决策优化的完整解决方案，其开源特性将推动学术界和产业界在复杂交互场景中的探索进程。

更多>同类资讯

AI重塑网络安全格局，周鸿祎携“倚天屠龙”开启中国安全新征程

周鸿祎认为，Mythos之所以引发震动，根本原因在于它能自主发现漏洞、分析漏洞甚至构造网络攻击“武器”，相当于AI时代的“网络核武器”，已经形成新的战略威慑。但Mythos的到来让攻防态势变成了敌快我慢、敌…

06-24

大疆与影石缠斗一年：资本、市场、技术多重博弈下的焦虑之争

06-24

亚马逊在德签最大购电协议，购600MW零碳电力助清洁能源组合扩容

06-24

SpaceX盘中跌破发行价后反弹，分析师：业务向好但估值偏高需谨慎

06-24

小米MiMo-V2.5-Pro-UltraSpeed延期体验，万亿参数模型推理速度再引关注

06-24

扎克伯格：Meta AI智能眼镜要时尚功能兼备，引领可穿戴新潮流

06-24

WPS被指广告多、缓存大、会员复杂，金山办公回应：相关优化正在推进

近日，“被WPS背刺”相关话题持续登上微博热搜，不少用户集中吐槽WPS在使用过程中存在系统卡顿、占用大量存储空间、广告频繁弹出以及会员收费复杂等问题。曾经凭借免费和本土化优势积累大量用户的WPS，如今正面临来自用户体验方面的新一轮争议。据了解，多位用户反映，

06-24

小米手表S4及S4 Sport新系统内测：微信体验升级语音转文字更便捷

06-24

小米REDMI K90至尊版6月30日发布：风冷散热加持剑指3K档游戏性能旗舰

06-24

硬件防窥屏成新趋势？国产手机纷纷跟进，是实用还是“带偏”？

06-24

小米YU7 GT实力出圈！创浙赛自动驾驶圈速纪录还登顶纽北赛道

06-24

多款App开屏广告悄然下架百度地图等提供关闭反馈新路径

06-24

凌川科技A+轮融资数亿元！全国产3D堆叠芯片流片，SL200已热销多国

06-24

阿里千问Qwen-AgentWorld问世：原生语言世界建模，突破通用智能体能力边界

06-24

法拉利首款纯电车Luce发布遇冷营销高管离职引外界猜测

06-24

点击查看更多 +

全站最新

2026款奥迪A6L e-tron来袭！3米1轴距+800V超充，续航最长815km

6月30日登场！宝马X5首创五动力同车，自研芯片统管全系底盘

德国专家旧论引热议：电动车污染真比燃油车大？真实数据算清账

东风奕派M8 6月28日开启预售纯电增程双动力+华为乾崑技术六件套

法拉利首款纯电Luce发布遇挫营销高管离职引外界猜测

五大平台种草逻辑大不同：母婴品牌如何精准匹配平台特性？

热门内容

本栏最新

五大平台种草逻辑大不同：母婴品牌如何精准匹配平台特性？

鸿蒙7：告别追赶时代，以创新之力开启全场景智能新纪元

小米YU7深海蓝配色停产引关注雷军：若呼声高可考虑“复活”该色

小米（MI）智能8寸平衡车：舒适安全续航强，亲子共享骑行欢乐时光

小米YU7“深海蓝”配色成绝版？雷军回应：若呼声高或考虑“复活”该色

内存成本飙升近翻倍，苹果扛压难继，iPhone 17 Pro等机型或迎涨价潮

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.