滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

多芯片算子自动生成新突破：KernelGen助力AI开发跨越“手搓”门槛

时间：2026-02-06 23:43:14 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在AI芯片生态日益多元化的背景下，如何降低跨平台软件迁移成本成为行业焦点。近期，众智FlagOS社区推出的KernelGen工具与统一编译器FlagTree组合方案，为算子跨芯片自动生成提供了系统性解决方案。该方案通过自动化工具链覆盖算子开发全生命周期，在华为昇腾、摩尔线程、海光、天数智芯等国产AI芯片及英伟达GPU上完成系统性验证，标志着算子开发模式从手工编码向工程化生产转变。

技术实现层面，KernelGen构建了四层架构体系：用户可通过自然语言、数学公式或现有代码描述需求；大模型驱动的智能体自动生成Triton内核代码；验证层构建多维度测试用例，在目标芯片上与PyTorch参考实现进行数值比对；最后通过性能评估与自动化调优确保执行效率。这种全流程自动化方案将算子开发效率提升数个量级，特别是在多芯片适配场景下，避免了重复开发带来的资源浪费。

统一编译器FlagTree是支撑跨芯片适配的核心基础设施。该项目自2025年启动以来，已支持12家厂商近20款芯片，涵盖DSA、GPGPU、RISC-V AI及ARM等多种架构。通过建立统一的硬件中间表示层，FlagTree将芯片差异封装在编译阶段，使算子生成逻辑无需关注底层硬件细节。最新发布的v0.4版本引入Triton语言扩展机制，提供Lite、Struct、Raw三层编程接口，既保证基础代码的跨平台兼容性，又为性能优化保留灵活空间。

实际评测数据显示，在110个代表性Torch算子的多轮生成测试中，KernelGen取得82%的编译成功率与62%的执行正确率。不同芯片表现呈现差异化特征：华为昇腾在代码生成阶段表现突出，英伟达平台则保持最高的数值准确性。当使用FlagTree编译器时，各平台执行正确率显著提升，特别是在英伟达GPU上达到70%的通过率，较原生编译器提升近20个百分点。这种稳定性优势为后续性能优化奠定了基础。

大模型能力差异在算子生成任务中表现明显。以华为昇腾平台为测试环境，GPT-5展现出最强综合能力，在110个算子中有65个实现完全正确的数值输出。GLM-4.7在复杂算子处理上存在波动，而Qwen3-Max等模型受限于语义理解深度，生成成功率相对较低。这表明算子自动生成不仅需要代码生成能力，更考验模型对数学运算逻辑、边界条件处理等底层机制的理解。

性能优化方面，通过引入模型自反思机制与专家知识库，KernelGen实现显著突破。在英伟达平台测试中，优化后算子执行正确率提升至75.5%，其中68.5%的算子获得超过1倍的加速效果，整体性能中位数达1.04倍。这种持续进化能力证明，算子自动生成已突破"可用"阶段，正在向"高效"方向迈进。特别在融合外部专家知识后，系统能够针对特定硬件特性进行深度调优，这种人机协同模式为AI基础设施发展开辟新路径。

当前行业面临的硬件碎片化挑战，在KernelGen方案中找到破局之道。该工具链通过抽象化硬件差异、自动化生成验证流程，将算子开发周期从数周压缩至小时级。在金融、医疗等对系统稳定性要求极高的领域，这种可验证的数值正确性保障具有特殊价值。随着FlagTree编译器支持的芯片数量持续增长，跨平台算子库的规模效应正在显现，有望解决长期困扰AI落地的"芯片孤岛"问题。

02-06

阿里千问App推广火力全开：冠名春晚、骑士服添标，还送30亿免单福利

02-06

阿里千问9小时订单超千万：扩容保障体验，盒马接入丰富免单品类

02-06

快手平台因色情低俗内容被罚1.191亿网信办督促整改保障网络安全

02-06

马斯克自曝SpaceX得州总部招聘难：位置偏远成障碍，特斯拉也受波及

02-06

梅赛德斯-奔驰携手京东，数字化零售再升级，原厂好物一键购

02-06

直播电商新趋势：治理深化生态优化，多元主体共促高质量发展

02-06

《Meta Thinker人机共生》启幕上海智能科技先锋联盟共绘产业新蓝图

02-06

宝马2026中国“大动作”：20款新车来袭，马年版亮相，本地化再升级

02-06

马斯克布局太空光伏：中国光伏技术或成关键助力新篇章

马斯克计划将太空光伏产能提升至每年100万颗太阳能AI卫星，目标在2030年前实现首个100吉瓦太空光伏里程碑。可以预见，在不久的将来，当我们仰望星空时，看到的不仅仅是闪烁的星光，还有那些搭载着中国光伏技…

02-06

雷军透露福特CEO试驾小米SU7：体验极佳，直言不舍与爱车分开

02-06

小米汽车春节出行保障暖心上线，24小时救援+多元服务伴您畅行新春

02-06

特斯拉积极布局中国市场：AI训练中心已启用，FSD获批进程受关注

02-06

马斯克预言：36个月内太空或成AI部署成本最低之地

02-06

千问Qwen团队发布PLaw Bench：法律大模型真实场景“大考”谁更优？

02-06

点击查看更多 +

全站最新

公告精选︱航宇科技：拟不超过1.05亿欧元投资建设斯洛伐克工业装备零部件锻造生产基地；真爱美家：不涉及人工智能业务

美股三大指数均涨超1%

中东Robotaxi进入"千辆时代"，文远知行携手Uber刷新区域纪录

2月9日A股投资避雷针︱天晟新材：因涉嫌信息披露违法违规证监会对公司立案

中东Robotaxi进入"千辆时代"，文远知行携手Uber刷新区域纪录

1.6万辆！中国重汽1月重卡出口再创新高

热门内容

本栏最新

科技新贵年会“豪”气冲天：追觅办演唱会，拓竹撒金条，游戏公司全员发金

2026眼镜进货渠道十强揭晓！批镜领跑数字化拿货，助力眼镜店高效经营

千问春节免单活动9小时订单破千万用户抢购火爆致系统“求饶”

新款小米YU7 GT申报图亮相：全黑车身配宽胎，极速300km/h性能强劲

网传新一代小米SU7 3月19日来袭！22.99万起售，配置升级引期待

冰天雪地成“考场”！多款新车扎堆冬测，极端环境验证硬实力

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.