滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

国科微倪亚宇：聚焦端侧智能，以创新NPU与工具链赋能多元场景

时间：2026-04-03 10:42:47 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在近期举办的“边缘AI与算力芯片”垂直技术论坛上，国科微AI算法部部长倪亚宇以《FlashAttention-4：新一代大模型推理NPU流水线范式设计》为题发表演讲，深入探讨了大模型端侧部署的技术挑战与突破方向。随着Transformer架构与大型语言模型在产业端的加速渗透，推理效率、内存带宽及系统功耗已成为制约端侧应用的核心瓶颈，而注意力机制的高效实现成为芯片架构优化的关键突破口。

倪亚宇指出，国科微正聚焦FlashAttention等前沿算法在NPU平台的落地应用，通过架构创新与工具链优化，构建适配端侧量产需求的计算解决方案。该技术可显著提升自动驾驶、边缘计算、智能终端及AIGC等场景的算力能效比，为大规模商业化部署提供支撑。当前，NPU部署“满血版”FlashAttention仍面临向量单元算力不足、异步流水调度效率低等挑战，需从计算流水线、数据复用机制及系统带宽协同设计三方面突破。

作为斯坦福大学于2022年提出的创新算法，FlashAttention通过分块计算、在线Softmax及异步流水等技术，将中间计算结果保留在片上缓存，大幅降低外部存储访问压力。其4.0版本在并行性、长序列支持及低精度计算能力上实现显著提升，但与GPU相比，NPU在动态调度、超长上下文处理等方面仍存在差距。国科微提出，需通过计算单元与存储系统的深度协同设计，才能充分发挥该算法的潜力。

在硬件架构层面，国科微自2020年起持续迭代NPU技术，已形成从1.0到4.0的完整演进路线。其最新GKNPU 4.0架构采用增强型脉动阵列设计，针对性强化矩阵与向量计算能力，通过压缩数据搬运路径、优化流水线开销，显著提升片上闭环计算效率。该架构可有效应对大模型推理中的带宽瓶颈、激活值碎片化及内存压力问题，目前已在AI视觉与车载芯片领域实现0.5T至8T算力的规模化应用。

工具链的升级是推动NPU落地的另一重要维度。国科微新一代GKToolchain 3.0聚焦端侧异构算力场景，通过硬件感知编译、自动分块及异步数据读写优化，实现模型部署从“可适配”到“高效率、可规模化”的跨越。该工具链还引入动态内存管理与投机推理加速技术，强化对长上下文及复杂推理流程的支持，帮助客户快速完成从模型训练到芯片部署的全链路闭环。

随着AI应用重心从训练侧向推理侧转移，产业对算力平台的需求正从“追求峰值性能”转向“兼顾能效与可量产性”。NPU凭借其成本与功耗优势，在端侧规模化部署中展现出独特价值。国科微表示，将持续推进算法与硬件的协同创新，围绕大模型推理的核心痛点优化NPU架构与工具链体系，为行业提供更具竞争力的端侧智能计算解决方案。

更多>同类资讯

浙江勃嘉自动化携核心部件亮相立嘉展，赋能西南制造业升级新动力

05-19

王力宏代言腾势N9闪充版上市科技豪华碰撞艺术共启高端新能源新程

05-19

腾势N9闪充版上市！40.98万起售，刀片电池+极速补能开启出行新体验

05-19

魏牌V9X上市：六座大型SUV新选择插混系统加持续航达1700km

05-19

腾势N9闪充版40.98万起上市，续航补能双突破，重塑豪华SUV格局

05-19

魏牌V9X六座大型SUV上市售价34.98万起插电混动续航达1700km

05-19

腾势N9闪充版上市！40.98万起售，刀片电池+极速补能引领新能源新体验

05-19

豆包App上线“博物馆讲解”功能，可边走边听AI导览

05-19

奔驰长轴距纯电GLC SUV定档：续航超700公里，7月上市

05-19

腾势N9闪充版上市：纯电续航420km，起售价40.98万元

05-19

云深处科技IPO获受理拟融资25.03亿元

05-19

学术界重拳出击，arXiv发布新规封杀AI代写论文行为

05-19

5 天击穿苹果 M5 最强内存防线！AI 辅助完成纯数据提权，Mac 安全格局巨变

05-19

AI垃圾报告挤爆安全通道，Linux创始人怒喷技术滥用

05-19

会“伪装”的AI：最新研究表明人们普遍认定人工智能比人类更自信

05-19

点击查看更多 +

全站最新

特斯拉座椅防夹功能实测：折叠遇障碍物秒回弹，细节守护安全

高德云图城市级仿真训练场：为具身机器人铺就真实场景落地“高速路”

全域营销新路径：中小团队借智能工具破投流困局，实现降本增效

Odoo助力麦科利中国：打破传统束缚，开启电商与多公司运营新篇章

刘东畅谈智能时代：互联网迈向新阶段，底层基建成竞争关键

京东Q1财报揭秘：经营利润扭亏为盈，外卖业务转型“轻资产”谋新篇

热门内容

本栏最新

高德云图城市级仿真训练场：为具身机器人铺就真实场景落地“高速路”

刘东畅谈智能时代：互联网迈向新阶段，底层基建成竞争关键

互联网热点技术大揭秘：AI、区块链、物联网如何重塑数字生活？

星宸科技车载激光雷达芯片进展迅猛 2027年规模化量产目标千万出货量

AI能否取代物理学家？中科院院士孙昌璞：创新思想与理论求证AI难以企及

车联天下：以技术创新为翼，从产品突破迈向全球产业体系新征程

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.