近期,东南大学九龙湖校区迎来了一场聚焦于人工智能技术的盛会——东南大学鲲鹏昇腾科教创新孵化中心特训营(第一期)成功举办。本次活动由东南大学鲲鹏昇腾科教创新孵化中心携手江苏鲲鹏·昇腾生态创新中心及东南大学网络与信息中心联合呈现,为期两天,吸引了众多计算机及相关专业的本硕博生前来参与。
特训营以昇腾AI基础软硬件解决方案、大模型训练与推理技术、DeepSeek架构解析及边缘部署等为核心议题,为学员们搭建了一个深度技术交流的宝贵平台。活动旨在通过课程培训和实战演练,推动基于鲲鹏昇腾底座的人才生态建设,加速国产化AI技术在高校科研与产业应用中的落地步伐。
在首日课程中,昇腾产品线专家杨越洋系统介绍了昇腾AI针对大模型训推场景的软硬件解决方案。他指出,大模型正由预训练向预训练+后训练转变,推理部署也由单机走向集群,创新迭代速度日益加快。昇腾AI软硬件技术为此提供了全场景技术支撑,硬件层面涵盖高带宽点对点通信、液冷一体化设计等,软件层面则包括MindSpore框架、MindSpeed训练加速库等,显著提升模型开发效率。
紧接着,MindSpeed研发专家刘哲续从算法、算力与数据三大维度剖析了大模型发展的趋势与挑战,并着重介绍了MindSpeed的技术架构。该架构依托昇腾NPU算力,通过通信优化、内存优化等技术,实现训练效率的显著提升。同时,MindSpeed还提供了LLM、MM、RL三大套件,分别针对大语言模型、动模态模型和强化学习部署。
昇腾计算工程师雷珍珍和程麟胜则分享了MindSpeed在大模型领域的成果。雷珍珍介绍了MindSpeed基于昇腾生态打造的分布式训练框架,能对主流大模型进行高效训练与微调。程麟胜则提到了MindSpeed MM,这是一款面向大规模分布式训练的昇腾多模态大模型套件,支持多模态生成及理解,旨在为昇腾芯片提供端到端的多模态训练解决方案。
昇腾生态技术专家焦泽昱则通过专题报告,全面解析了基于MindIE的大模型推理和DeepSeek技术原理与架构。他介绍了MindIE推理引擎的分层开放架构,并演示了从镜像拉取到服务化部署的全流程。针对DeepSeek技术,他逐一剖析了其核心创新技术,包括DualPipe双向流水、MoE负载均衡等,并特别提到了DeepSeek的开源策略对行业格局的影响。
在实战环节,江苏鲲鹏·昇腾生态创新中心高级工程师韩升原现场演示了DeepSeek模型部署全流程,并分享了报错排查经验与显存计算公式,为学员们提供了实用参考。昇思MindSpore布道师崔花婷还带领学员在昇腾开发板OrangePi Alpro(20T)上完成了Janus-Pro模型部署实战,让学员们切身体验了在终端设备进行模型部署运行的全流程。
活动最后,特训营为学员们举办了成果展示与结营仪式,并颁发了结课证书。东南大学网络与信息中心副主任胡轶宁表示,孵化中心将持续推进“科研-教学-产业”闭环,培养具备鲲鹏昇腾原生开发能力的复合型人才。昇腾计算技术开发团队负责人也鼓励学员们积极投身国产AI生态建设,为技术攻坚贡献力量。