滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智源发布Emu3.5多模态世界大模型，开启AI迈向物理世界新征程

时间：2025-11-03 09:22:59 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

智源研究院在北京举办的“悟界·Emu系列技术交流会”上，正式推出Emu3.5多模态世界大模型。这款由智源院长王仲远与多模态大模型负责人王鑫龙联合发布的成果，标志着人工智能从语言认知向多模态世界建模的跨越式发展。该模型通过单一自回归Transformer架构实现端到端原生多模态训练，在10万亿token级数据上完成预训练，视频数据训练时长从15年激增至790年，参数规模从80亿扩展至340亿，为多模态大模型的规模化发展开辟新路径。

技术突破方面，智源独创的“离散扩散自适应”（DiDA）技术将图像推理效率提升20倍，使自回归模型首次达到闭源扩散模型的生成速度。模型采用“预测下一个状态”的核心训练目标，通过海量多模态数据自发学习物理世界的运行规律，形成对时空连续性和因果关系的内在表征。这种非硬编码的知识获取方式，使Emu3.5具备长时程环境交互能力，与单纯内容生成模型形成本质区别。

作为新一代世界模型，Emu3.5构建了完整的预测系统，在理解、预测、规划三个维度形成闭环。其独特能力体现在：可解析高层意图并生成多步骤行动方案，如规划“宇宙飞船制造流程”或“咖啡拉花步骤”；在统一框架内实现物理动态模拟与因果关系推演；通过涌现的因果推理能力支持具身交互，为机器人操控提供认知基础。这些特性使模型既能生成行动指南，又具备基础物理直觉，可在多场景中实现可控探索。

在功能表现上，Emu3.5展现出跨模态时序一致性优势。其多模态叙事能力可围绕任意主题创建沉浸式故事体验，具身操作模块支持跨场景动作规划与复杂交互。在图文编辑领域，模型通过自然语言指令实现精准时空变换，文图生成质量超越多数闭源模型。基准测试显示，该模型在多维度评估中均达到行业领先水平。

研发路径上，智源研究院延续其创新定位，聚焦高校与企业未涉足的AI前沿领域。作为国内最早开展大模型研究的机构，团队曾成功孵化悟道系列模型，培养众多行业领军人才。近两年转向多模态与物理世界AI研发，基于对技术演进趋势的判断，主张通过原生多模态架构统一感知与生成能力。2024年发布的Emu3已验证自回归架构的可行性，此次Emu3.5进一步证明模型性能可随数据、算力、参数规模同步提升。

王仲远在发布会上强调，Emu3.5开创了多模态Scaling的新范式，为构建通用世界模型提供可量化的实践路径。模型通过模拟人类自然学习方式，在“下一状态预测”框架下实现世界建模能力的泛化。目前，智源已启动学术合作计划，将向科研机构开放Emu3.5体验版，同时通过官方渠道启动产业界邀请测试，推动多模态世界模型的技术生态建设。

更多>同类资讯

OpenAI负责人：人类编写提示词与验证成AGI发展瓶颈期待新突破

12-15

2025中国电影市场：500亿票房背后，动画、抗战、艺术片齐发力

12-15

能源管理控制器：数据驱动，引领企业迈向高效绿色智能能源新时代

在电力监控系统方面，采用先进的传感器技术和通信技术，能够实时、准确地采集电力数据，并通过智能算法进行分析和处理，为用户提供优秀的电力运行状态信息；在能源管理系统中，利用大数据和云计算技术，帮助用户实现能源的精…

12-15

沈阳“十五五”规划建议出炉：强化基建加速AI算力集群与全国体系融合

12-15

清华大学艺科周：以多元活动解锁人机共生时代艺术科技新图景

12-15

从AI赋能到原生觉醒：陈天桥深度剖析AI进化三阶段与文明重塑思考

12-15

日本年轻人AI使用图鉴：查询学习是主流女性更爱寻求建议与咨询

12-15

OpenAI负责人：人类打字与验证成AGI瓶颈，重构系统或迎突破增长

12-15

微信输入法iOS 3.0内测来袭，语音输入升级，方言英文超长记录都支持

12-15

OpenAI负责人：人类编写提示词及验证或成AGI发展掣肘突破在望

Alexander 表示，人类的打字速度将成为通用人工智能（AGI）的发展瓶颈，主要原因是人们仍需要通过写提示词（Prompt）来引导AI，并亲自检查、验证 AI 的输出结果。 IT之家注：通用人工智能（…

12-15

海归博士胡宇航创办首形科技获中网投蚂蚁集团等联合领投新一轮融资

瑞财经吴文婷12月12日，首形科技（AheadForm）宣布完成新一轮融资。本轮由中国互联网投资基金（中网投）与蚂蚁集团联合领投，其他投资人包括上海未来产业基金、东方富海，老股东招商局创投持续超额追投，深…

12-15

OpenAI负责人：人类编写提示词与验证速度或成AGI突破关键阻碍

Alexander 表示，人类的打字速度将成为通用人工智能（AGI）的发展瓶颈，主要原因是人们仍需要通过写提示词（Prompt）来引导AI，并亲自检查、验证 AI 的输出结果。 IT之家注：通用人工智能（…

12-15

OpenAI负责人：人类打字速度或成AGI掣肘，全自动化流程有望突破瓶颈

12-15

海辰储能第三届生态日：首发三项成果，剑指储能“1毛钱时代”

12-15

Aetherflux太空数据中心Galactic Brain，2027启发射

12-15

点击查看更多 +

全站最新

雷军回应“准新车”引争议，运损车贴新标，消费者质疑诚意与责任

雷军详解小米“准新车”开售，全年交付量有望突破40万辆大关

新迈腾B9：智慧配置升级通勤体验，多重福利助力轻松购车

知乎2025电Club新知技术大会：聚焦新能源，共探技术革新与信任构建新路径

特斯拉Robotaxi新突破：奥斯汀街头开启无安全员无乘员路测

汽车熄火刹车变硬别慌！行驶中突发熄火3步“保命”操作速收藏

热门内容

本栏最新

燃油车新标杆！迈腾2026款以智慧进化续写德系传奇

广汽高域韶关新丰试飞基地授牌构建飞行汽车测试新场景

全新深蓝S07华为乾崑630长续航版：续航智能双优，重塑出行新体验

极石ADAMAS将登场，增程中大型SUV，大气外观配6座7座，竞争力如何？

东方美学邂逅科技锋芒，岚图泰山以全能实力重塑豪华SUV新格局

宝马在华推出“盖亚”AI平台，以智能基座驱动全价值链协同升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.