滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Meta FAIR推出首个代码世界模型CWM：模拟执行、自我调试，代码能力再进阶

时间：2025-09-25 10:01:37 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

meta FAIR实验室近日宣布推出全球首个系统性引入世界模型概念的代码生成语言模型——CWM（Code World Model）。这款参数量达320亿、支持131k tokens长上下文的密集语言模型，在代码生成与推理领域实现了关键突破，标志着代码大模型从静态文本预测向动态执行理解的范式转变。

与传统代码生成模型不同，CWM首次将"代码世界建模"理念融入训练框架。通过追踪代码执行过程中变量状态的动态演变，该模型能够模拟程序运行轨迹，理解函数调用的副作用，甚至预测潜在执行错误。研究团队形象地将其类比为"神经调试器"，可在标记空间中实时追踪程序状态变化，如同为代码运行配备可视化调试工具。

在核心能力构建上，CWM实现了三大技术升级：其一，动态执行模拟能力可逐行解析代码对程序状态的影响，支持循环展开、边界条件测试等复杂场景；其二，自我修复机制能自动生成测试用例，通过多路径尝试修复代码缺陷，形成"编写-测试-修正"的完整闭环；其三，推理规划模块可针对复杂问题拆解步骤、规划函数结构，并通过执行预测验证解决方案，展现出多轮逻辑推导能力。

基准测试数据显示，CWM在多个权威评测中表现优异：SWE-bench Verified得分65.8%，超越所有同规模开源模型，接近GPT-4水平；LiveCodeBench v5编程任务准确率达68.6%；数学推理方面，AIME 2024模拟题得分76.0%，Math-500测试达96.6%；终端操作任务Terminal-Bench得分26.3%，优于Gemini 2.5 Pro。这些成绩验证了动态执行建模对提升代码生成可靠性的显著价值。

技术架构上，模型采用64层decoder-only Transformer结构，局部与全局注意力机制交替设计，在保持长上下文处理能力的同时优化计算效率。训练过程运用FlashAttention-3加速、FSDP+TP并行策略及fp8低精度计算，严格遵循前沿AI安全框架，确保模型不会对高敏感领域构成风险。

研究团队同步开源了预训练模型、监督微调版本及完整训练权重，提供三个检查点供学术界使用。但特别指出，该模型专为代码理解与复杂推理研究设计，未进行RLHF对齐优化，因此不适合对话场景或商业应用，仅面向非商业研究用途。

针对外界关于"语言模型路线"的质疑，meta首席AI科学家LeCun回应称，CWM的创新聚焦于编程领域的动态执行理解，与通用人工智能发展路径形成互补。研究核心贡献者Gabriel Synnaeve强调，团队通过跨学科协作验证了世界建模对提升代码生成可靠性的有效性，这项突破为构建自动化编程助手奠定了技术基础。

当前版本的世界建模数据主要覆盖Python语言，研究团队正探索多语言扩展方案。通过开源模型代码与训练细节，meta期望推动代码生成领域向可解释、可调试、可规划的方向发展，同时引发学术界对"模型世界理解能力边界"的深入探讨。

更多>同类资讯

大模型成多智能体“中枢”，AI云作“超级引擎”：阿里绘就智能新蓝图

09-25

中国AI发展：以数据模型算力为基，促全球普惠与文明多样共荣

09-25

MiniMax陷版权漩涡：海外狂飙遇阻，上市之路能否冲破重重阴霾？

09-25

OpenAI豪掷万亿进军AI基建，启动超大规模算力扩张，布局下一代大模型

09-25

1688云栖大会秀AI实力，跨境AI「遨虾」内测，AI版App功能再升级

09-25

研华携手国讯芯微推出Thor平台控制器，推动机器人智能化新突破

此次合作不仅是硬件与软件层面的深度协同，更标志着工业控制领域向“感知—决策—执行”一体化自主智能迈出了坚实一步：赋能产业升级，解锁应用新场景：双方合作的产品将极大推动AI从“云端”走向“边缘”，深入复杂现…

09-25

钉钉CTO朱鸿：AI时代人辅助AI，钉钉助力企业打造专属模型开启共生新篇

面向千行百业，钉钉希望能够成为行业模型和企业智能体工厂，让每一家企业都能低成本、高效率地构建和应用自己的专属大模型。 “我们首创了‘AI按效果付费’模式——先用后付，效果说话，让企业敢用、能用、用得起AI，也…

09-25

9月24日阿里巴巴重大发布：与英伟达合作、推新品，吴泳铭畅谈AI未来

据了解，Qwen3-Coder是通义千问的AI编程大模型，拥有多个尺寸，编程能力登顶全球开源模型阵营。此次发布的Qwen3-Max作为压轴出场的模型，大幅提升了编码和智能体能力，在多项权威基准测试中稳居全球顶…

09-25

阿里巴巴9月24日动作频出：宣布合作、推新品，吴泳铭畅谈AI未来愿景

据了解，Qwen3-Coder是通义千问的AI编程大模型，拥有多个尺寸，编程能力登顶全球开源模型阵营。此次发布的Qwen3-Max作为压轴出场的模型，大幅提升了编码和智能体能力，在多项权威基准测试中稳居全球顶…

09-25

吴泳铭云栖大会演讲定调AI蓝图，阿里股价飙升2200亿港元

09-25

2025云栖大会：阿里云发布七款大模型，吴泳铭勾勒ASI终极愿景

09-25

1688云栖大会秀AI实力，“遨虾”内测及App迭代助力B2B生意智能化

09-25

吴泳铭云栖大会演讲，勾勒AI蓝图，阿里市值两小时增2200亿

09-25

金星智控携手铜陵有色金冠铜业智能冶炼方案入选安徽未来产业优秀案例

09-25

2025云栖大会：阿里吴泳铭勾勒ASI蓝图，3800亿投建AI基础设施共赴未来

阿里云作为“全栈人工智能服务商”，将通过两大核心路径实施AI战略：第一，通义千问坚定开源开放路线，致力于打造“AI时代的Android”；其二，构建作为“下一代计算机”的超级AI云，为全球提供智能算力网络。程…

09-25

点击查看更多 +

全站最新

雷军谈小米造车与造芯：同时决策如供俩孩子上大学，压力如山感慨多

雷军坦言造车与造芯双线并进，押上小米十年积蓄，直言“双线作战”压力如山

AI浪潮下TCL电子的破局之道：以技术重构业务，用创新拓宽边界

福特中国整合江铃与长安渠道：资源重组下能否开启发展新篇？

阿维塔战略2.0启航：“国家队”助力迈向全球“新豪华”新征程

叶菲庆贺米其林沈阳工厂三十载，共绘“未来工厂”可持续新蓝图

热门内容

本栏最新

第22届东博会AI元素亮眼：数字智能体引路机器人炫技展风采

AI云竞争下半场：华为以超节点、企业Agent等破局，谁能领跑产业？

2025网安周：每日互动刘宇谈AI时代，知识安全成关键，共筑数字新未来

中国大模型DeepSeek首登Nature封面，R1训练成本仅约208万引关注

华为全联接大会2025启幕，发布全球最强算力超节点与集群

有鹿机器人+连合直租：以智能租赁模式，开启高端场景清洁新未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.