在近日举行的中国国际大数据产业博览会开幕式上,华为云计算的首席执行官张平安发表了重要演讲,深入探讨了算力在当前科技领域的重要性以及华为云在此领域的布局。
张平安强调,尽管芯片技术至关重要,但更重要的是如何为客户提供所需的精确计算结果。他透露,华为云正全力打造算力基础设施,即所谓的“算力黑土地”,旨在通过昇腾AI云服务和Tokens服务,满足客户对最终计算结果的追求。
面对大模型发展对AI基础设施提出的新挑战,张平安指出,未来十年,算力需求或将激增数万倍。然而,国产芯片的发展正面临来自美国的重重封锁。在此背景下,他提出了华为的解决方案:利用光通信、网络、供电等多方面的技术优势,通过系统集成,以空间、带宽和能源换取算力,从而在云上构建算力集群,实现规模优势和性能提升。
今年4月,华为云推出了CloudMatrix384超节点,该超节点通过全新高速网络MatrixLink将384颗昇腾NPU和192颗鲲鹏CPU全对等互联,形成一台超级“AI服务器”,算力规模高达300 PFlops。该超节点还支持万亿、十万亿参数的大模型训练任务,可通过横向扩展,将多个超节点组成一个庞大的AI集群。
在博览会上,华为云还宣布Tokens服务已接入CloudMatrix384超节点,通过xDeepServe架构创新,实现了单芯片的高吞吐、低时延,性能远超业界水平。xDeepServe架构采用了Transformerless的极致分离设计,将MoE大模型拆分为可独立伸缩的微模块,并通过高效的通信库和自研推理引擎,将这些微模块重新组合成一个超高吞吐的LLM服务平台。
张平安表示,昇腾AI云服务是国产的,他们并不在意芯片的具体纳米级别,而是更关注AI云服务能否为客户提供所需的算力服务和Token服务。他透露,华为云的超节点在50ms时延下,每卡可生产2400个Token,效率是H20的三倍,并支持包括盘古在内的多种主流开源大模型。
华为云正在围绕贵安、乌兰察布、和林格尔、芜湖等核心枢纽,打造“全国算力一张网”。目前,贵州已部署超过40套CloudMatrix384超节点。与去年同期相比,华为云的整体算力规模增长了近250%,昇腾AI云服务客户数量也从321家增长到1714家,且连续756天保持重大事故为零的记录。
在智能驾驶领域,华为云也发布了CloudVeo智能驾驶云服务等一系列解决方案和成果。华为云贵安汽车专区已正式上线,长安天枢智驾也搭载了华为云CloudMatrix 384超节点。据透露,中国最大的智能驾驶(辅助)企业引望已经运行在昇腾平台上,多个项目的实际测试结果显示,CloudMatrix 384超节点在典型感知模型、E2E、VLA模型上的性能表现优异。
近期,华为云的组织架构调整也引起了广泛关注。据市场传言,华为云多个部门被裁撤整合,以聚焦3+2+1业务,即通算、智算、存储三大核心业务,AI PaaS、数据库两大平台业务,以及安全业务。这一调整被分析人士视为华为云在AI时代的一次战略抉择,旨在通过砍掉协同效应弱、资源消耗大的外围研发,将所有力量集中到能最大化“昇腾AI+盘古”组合优势的核心场景上。
尽管华为云在中国大陆云服务市场中的份额仍落后于阿里云,但其在AI领域的布局和投入正逐渐显现成效。张平安表示,当前是人工智能应用行业落地的加速期,中国拥有丰富的业务场景和积极的AI拥抱态度,有望在各行业构筑起全球领先的优势。他呼吁企业积极拥抱AI原生思维,围绕AI重新构建应用、数据、流程和人员,以充分发挥AI的潜力,提高效率和创新业务模式。
在演讲的最后,张平安还提到了AI未来的发展趋势。他认为,随着AI技术的不断进步和应用场景的拓展,AI将逐渐从辅助工具转变为执行任务的主体,而人的角色则将转变为管理AI、控制AI的开关。对于希望用AI构筑领先优势的企业来说,只有通过AI原生思维来拥抱AI,才能抓住智能时代的机遇,实现智能跃迁。