摩尔线程开源TileLang-MUSA项目，降低国产GPU开发门槛加速AI应用落地

时间：2026-02-11 06:44:26 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

摩尔线程近日宣布开源TileLang-MUSA项目，为国产GPU开发领域注入新活力。该项目通过完整支持TileLang编程语言，致力于充分挖掘全功能GPU的性能潜力，同时显著降低国产GPU的开发门槛，为行业带来新的发展契机。

TileLang作为一种高性能AI算子编程语言，基于张量分块抽象构建，属于领域特定语言（DSL）。它采用声明式语法与类Python前端，让开发者能够以类似数学公式的方式表达计算意图。编译器会自动完成循环优化、内存调度和代码生成等复杂任务，在确保底层性能的前提下，极大降低了GPU及异构计算平台的编程复杂度。

在实际应用中，TileLang展现出诸多优势。其高级抽象特性降低了开发门槛，且具备跨平台能力，实现“一次编写、多架构运行”。编译器可自动执行Layout推导、线程映射、Warp特化、流水线排布和内存优化等操作，在保障性能的同时提升开发效率，广泛应用于AI与机器学习、科学计算等领域。TileLang-MUSA项目则提供了介于底层汇编与高层DSL之间的“中间层”抽象，在保留硬件控制力的同时，大幅降低编程复杂度。

该项目在硬件兼容性方面表现出色，已在摩尔线程多代全功能GPU上完成功能验证与打通，包括训推一体全功能智算卡MTT S5000和MTT S4000。团队成功实现了TileLang高层语义到摩尔线程GPU底层MUSA架构的精准映射，具体体现在多个方面：编译器能自动调用MUSA的MMA指令，充分发挥硬件张量核心的峰值计算能力；自动处理从全局内存到共享内存再到寄存器的多级数据搬运，利用MUSA异步拷贝指令掩盖访存延迟；完整支持Warp Specialization特性。目前，基于MUSA架构的TileLang原生算子单元测试覆盖率已超过80%，为大规模应用提供了可靠保障。开发者在完成环境配置后，可保留原有的import tilelang习惯，通过Cython编译后端直接在MUSA环境中运行TileLang代码。

在实际算子开发实践中，TileLang-MUSA项目成果显著，实现了开发效率与运行性能的双重提升。以大语言模型中重要的FlashAttention-3和GEMM算子为例，在摩尔线程MTT S5000上的测试结果显示，开发效率大幅提升，代码量相较手写MUSA C++代码减少了约90%，且代码逻辑更清晰，降低了开发与维护成本。性能方面，得益于编译器优化，生成的算子性能在典型配置下，Gemm最高可达手写优化版本的95%，FlashAttention-3可达手写优化版本的85%。借助TileLang-MUSA的Auto-tuning机制，开发者可在MUSA架构的全功能GPU上快速搜索最优的分块策略和流水线级数，轻松超越未经深度优化的基准实现。

TileLang-MUSA项目的推出，具有多方面重要意义。它使TileLang用户能够近乎零成本地将算子逻辑迁移至摩尔线程GPU，为不熟悉MUSA指令集的AI工程师提供了高层次的开发入口。同时，通过支持FlashAttention等关键算子的高效开发，加速了大语言模型等前沿AI应用在国产算力平台上的部署与落地。

摩尔线程计划持续推进平台与生态建设，将TileLang-MUSA开源视为构建国产算力生态的关键一步。后续计划包括深度集成SGLang等主流AI框架，实现Transformer、MoE等复杂模型架构的跨算子调度与全局优化；完善调试和性能分析工具链；通过性能优化，开发更多MUSA架构定制扩展，使生成代码性能稳定达到手写优化版本的90%以上，为构建开放、易用的国产算力开发生态提供有力工具支撑。

2月10日，微博热搜发布2025年十大热搜汽车品牌榜单，以小米汽车、鸿蒙智行为代表的科技属性品牌占据舆论高地，而传统豪华阵营BBA中仅奥迪跻身前十，成为榜单中唯一独苗。榜单数据显示，小米汽车全年累计登上微博主…

现代汽车与谷歌旗下自动驾驶公司Waymo的合作，预示着自动驾驶领域又一重大进展。IONIQ5作为现代汽车的明星车型，其设计和技术都代表了现代汽车的最新水平。对于Waymo而言，获得5万辆IONIQ5，将有助于…

她成功塑造了一个坚韧的女性形象，不仅在性格上的倔强和坚持理想的决心表现得淋漓尽致，而且在外形上也突破了自己，干裂的嘴唇、脏兮兮的脸，这对任何一个女演员来说，都是一大挑战。胡歌和杨紫或许在演技上有所欠缺，但金巴…

超越Sora尚在其次，更重要的是，物理世界的准确建模被视为通用AGI的关键能力之一，而Seedance2.0让业内人士看到了实现这一点的可能性。目前来看，Seedance 2.0另一大爆火的原因，是创作…

【科技快报网】2月10日消息，今日萝卜快跑与Uber共同宣布，2026年第一季度将在阿联酋迪拜推出全无人驾驶出行服务，这也是迪拜首次迎来全无人驾驶出行服务。今年1月，萝卜快跑已与AutoGo在阿布扎比启动面向…

【CNMO科技消息】2月10日，小米汽车官方正式宣布，在春节期间，小米汽车APP商城将持续运营，推出一系列活动，但部分服务也将暂时停运。官方表示，此次春节活动主要面向车主展开。在活动期间，车主专享多重福利，可…

小米集团董事长兼CEO雷军近期发布了一段小米SU7的冬季测试视频，虽然引起了网友的关注，但评论普遍反映视频质量平平。在YU7GT的申报信息中，显示其双电机动力系统的最大功率可达1003马力，标志着小米在高性能…

2月10日，小米创办人，董事长兼CEO。雷军表示，前段时间，一辆YU7行驶在美国加州的高速公路上，挂着当地的测试车牌引起很多人疑问，小米是不是准备进入美国市场。对此，雷军正式回应称，“我们目前暂时没有进入美国…

具体来看，标准版车型续航由700km提升至720km；Pro版车型续航从830km大幅提升至902km；Max版车型续航则由800km提升至835km。内饰方面，新车新增“暗夜黑”配色方案，方向盘造型向YU7…

工信部发布了《减免车辆购置税的新能源汽车车型目录（第二十七批）》，其中披露了新一代小米SU7的续航信息。新车申报了73kWh、96.3kWh、101.7kWh三种规格的电池包，对应CLTC工况下九种不同的续航…

小雷也头一回见SUV去刷圈，要我说啊，小米这行为真是说是目前暂时没有进入美国市场的计划。毕竟，对于喜欢性能又不差钱的消费者来说，小米在这赛道上还是有优势的。但话又说回来，这年头的车企们也不是吃素的，主打一个你…

在汽车行业的快速变化中，德赛西威（SZ002920）正稳步前行，抓住市场机遇，展现出强大的创新能力。德赛西威的核心业务一直集中在汽车电子产品的销售上，但随着行业发展和消费者需求的变化，公司正在积极布局新产品和…

来源：问董秘投资者提问：德赛西威是否给萝卜快跑提供了技术支持？您好，目前公司主要为销售汽车电子产品，另外，公司在稳固核心主业根基的同时，积极把握市场机遇，前瞻性布局具有战略意义的新产品与新业务领域。通过充分利…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.