在2025年世界人工智能大会(WAIC)的盛大舞台上,商汤大装置携手上海人工智能实验室(上海AI实验室),共同揭晓了一项旨在重塑AI算力格局的创新方案——基于DeepLink的异构混合调度系统。这一突破性进展标志着商汤大装置的核心能力体系迎来了深度进化,将国产AI算力推向了一个全新的高度。
活动期间,商汤大装置事业群的产品领航者卢国强与上海AI实验室的DeepLink解决方案专家王峰,在WAIC UP魔盒直播间进行了精彩的解读,深入剖析了该方案的技术内核与行业价值。他们指出,面对国产算力资源分散、异构芯片调度繁琐、跨域训练稳定性欠缺等现状,DeepLink异构混合调度系统犹如一把钥匙,打开了高效协同与稳定运行的大门。
DeepLink,作为上海AI实验室倾力打造的人工智能开放计算体系,其核心使命在于搭建硬件芯片与深度学习软件框架之间的无缝桥梁,促进软硬件生态的深度融合与开放共享。通过DeepLink,AI芯片与基础框架得以紧密联结,上下游厂商仅需一次适配,便能轻松接入广阔的算法海洋,实现软硬件的灵活解绑,打破了传统生态的界限。
针对当前大规模集群建设中存在的软硬件适配不足、资源利用率低下、供需失衡等痛点,上海AI实验室率先迈出了探索的步伐,研发出DeepLink超大规模跨域混训技术方案。该方案凭借训练加速、异构通信、并行策略等核心技术创新,成功跨越了芯片架构的鸿沟,重构了计算资源的调度体系,为智算中心的互联与超大模型混训提供了坚实的技术支撑。今年早些时候,上海AI实验室已携手包括商汤在内的多家伙伴,在上海成功构建了超大规模跨域混训集群原型,并在自研的千亿参数模型上,实现了长达20天的稳定训练,效率直逼单一芯片集群的巅峰水平。
此次发布的基于DeepLink的异构混合调度方案,是商汤大装置与上海AI实验室深度合作的重要里程碑。该方案的深度融合,展现了以下几大亮点:它能够实现多种国产芯片间的无缝协同与统一调度,通过智能优化并行策略与负载均衡,真正做到了“芯片各异,平台一统”的高效协同;它显著提升了异构调度与弹性算力的灵活性,以秒级伸缩、分钟级故障恢复的能力,确保了大模型训练过程的平稳、高效与可控;同时,它还全面兼容DeepSeek、InternLM、LLaMA、Qwen等主流大模型,适配稠密模型与MoE架构,为训练与推理的高效执行提供了强有力的支持。
卢国强在解读中强调,借助DeepLink异构混合调度方案,商汤大装置将进一步拓宽GPU适配范围,加速训练与推理场景的拓展与商业化落地。未来,商汤大装置与上海AI实验室将持续深化合作,加速国产AI算力芯片的适配与优化进程,共同夯实国产AI生态的基石,为智能时代的产业升级注入澎湃的技术活力。