滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

华为云Tokens服务接入384超节点，突破AI算力增长瓶颈

时间：2025-08-29 14:59:28 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

在第四届828 B2B企业节盛大开幕的当天下午，华为云传来了一则令人瞩目的消息：其Tokens服务已成功全面融入CloudMatrix384超节点，这一融合标志着华为云在AI算力领域的又一次重大突破。

得益于xDeepServe架构的创新应用，华为云Tokens服务的性能得到了显著提升。具体而言，该服务在单芯片上实现了2400TPS的吞吐量，同时保持了50ms的TPOT（Token处理时延），这一成绩无疑为AI算力的应用树立了新的标杆。

近年来，中国AI算力需求呈现出爆炸式增长。数据显示，从2024年初至2025年6月底，中国的日均Token消耗量从1000亿激增到30万亿，短短一年半时间内增长了300多倍。这一趋势对算力基础设施提出了前所未有的挑战。为了满足这一需求，华为云在2025年3月推出了基于MaaS（模型即服务）的Tokens服务，提供了多种规格以满足不同应用场景的需求。

此次Tokens服务与CloudMatrix384超节点的结合，更是将这一服务的性能推向了新的高度。依托超节点的xDeepServe框架，Tokens服务的吞吐量从年初的1920TPS跃升至2400TPS。这一提升的背后，是华为云对于大算力构建全栈创新的深刻理解，包括硬件、软件、算子、存储、推理框架及超节点等各个环节的协同优化。

xDeepServe架构作为CloudMatrix384超节点的原生服务，其创新之处在于采用了Transformerless极致分离架构。这一架构将MoE大模型拆解为Attention、FFN、Expert三个可独立伸缩的微模块，并通过微秒级XCCL通信库与FlowServe自研推理引擎进行高效整合。经过这样的优化，单卡的吞吐量从非超节点的600tokens/s大幅提升至2400tokens/s。

华为云还透露了xDeepServe架构的未来发展计划。目前，该架构已经实现了MA分离，未来还将进一步将Attention、MoE、Decode改造为数据流，并扩展至多台超节点，以实现推理吞吐的线性提升。

在应用层面，华为云Tokens服务已经支持了包括DeepSeek、Kimi、Qwen等在内的主流大模型，以及versatile、Dify等主流Agent平台。同时，华为云还与超过100家合作伙伴携手，在多个领域开发AI Agent，如调研分析、内容创作、智慧办公、智能运维等。这些应用不仅提升了服务效率与客户满意度，还推动了政企办公的智能化转型。

例如，基于MaaS平台的今日人才数智员工解决方案，通过集成自然语言处理、机器学习等技术，为企业提供了智能化的人才管理服务。而北京方寸无忧科技开发的无忧智慧公文解决方案，则利用AI技术实现了公文的自动化处理，大大提高了办公效率。

更多>同类资讯

川渝高校学子齐聚四川广汉机器人及人工智能大赛探索科技新边界

据悉，本次大赛采用线上线下紧密结合、同步办赛模式，全面考察选手机器人技术、人工智能算法、跨学科协作等综合能力，既保障赛事前沿创新性与现场观赏性，又充分调动大规模参赛群体的积极性。线上比赛方面，机器人创新赛…

05-31

2026互联网优质内容创作盛典启幕，海辛阿文解锁AI创作质感作品新路径

05-31

鼎捷数智发布企业智能运行空间，为制造业AI转型提供完整闭环新路径

05-31

同济大学研发首代滚动优化芯片助力自动驾驶与机器人“智慧决策”

05-31

上海科学与艺术交融：音乐沙龙开启科艺新篇共赴未来之约

05-31

同济大学研发首代滚动优化芯片助力自动驾驶与机器人“智慧升级”

05-31

华为携手光明科学城公司及深圳先进院共筑合成生物科研与ICT协同创新体系

05-31

三方携手共筑创新体系推动合成生物学与ICT深度融合发展

05-31

6月车市盛宴来袭！5款SUV新车扎堆上市比亚迪大唐等热门车型谁更值得期待？

05-31

思格新能源推出SigenAgent：以AI赋能能源管理，开启全场景智能新篇章

为精准覆盖从家庭到企业的全场景能源管理，SigenAgent首发即推出了四大智能体，覆盖家庭用能、电站运维、电力交易与企业经营等核心场景，将复杂的能源管理任务转化为清晰的目标指令，帮助不同用户全面提升用能效…

05-31

三星12层HBM4E样品启航：性能跃升超20% 引领AI存储新篇章

5月29日，三星电子宣布首次向全球客户提供最新一代高频宽内存——12层堆叠的HBM4E样品，该芯片将成为下一代人工智能加速器的核心，将有望巩固其在HBM 市场的领先地位。在容量方面，HBM4E 12层产…

05-31

北京联合大学应用科技学院校园文化周：技能展示绽放青春光彩

新京报讯（记者冯琪）学生们现场焊接组装七音阶电子琴、操作无人驾驶智能车绕过障碍物、指挥机器人跳起秧歌舞，5月27日，在北京联合大学应用科技学院举办的“项目赋能·智创未来”校园文化周活动上，专升本学生特色技能培…

05-31

龙泽智能传动：工业机器人与精密机床传动优选定制化服务赋能多场景

产品适配性：需验证减速机传动比、扭矩、防护等级是否匹配设备工况，例如半导体设备需选择IP65防护、低抖动型号；技术稳定性：关注企业研发历史与专利积累，避免选择仅能提供标准品而缺乏非标定制能力的厂家；服务响应…

05-31

思格新能源发布SigenAgent，AI赋能能源管理开启“智能体时代”新篇

为精准覆盖从家庭到企业的全场景能源管理，SigenAgent首发即推出了四大智能体，覆盖家庭用能、电站运维、电力交易与企业经营等核心场景，将复杂的能源管理任务转化为清晰的目标指令，帮助不同用户全面提升用能效…

05-31

北京机器人产业“加速跑”：从量产到场景应用，开启智能新时代

中新社北京5月30日电 (记者陈杭)机器人在工厂高效量产、“机器人学校”开展数据训练、机器人4S店提供场景化展示体验……在北京，机器人正加速融入生产生活。北京人形机器人创新中心具身智能机器人数据与训练基地内…

05-31

点击查看更多 +

全站最新

2026智博会“海陆空”机器人齐聚消费级AI产品涌现见证AI落地新图景

“混知”陈磊：以趣味漫画破知识壁垒碎片化时代深耕内容价值

雄魂美学遇上华为乾崑！全新猛士M817预售价37万起，开启智能越野新篇章

2026半固态电池价值论坛启幕张朝阳：半固态电池破解当下难题更具现实性

2026款吉利牛仔上市！配置升级潮野范足，限时优享7.59万起

本田CRF450系列7月焕新登场！新发动机新车架，越野体验再升级

热门内容

本栏最新

6月车市盛宴来袭！5款SUV新车扎堆上市比亚迪大唐等热门车型谁更值得期待？

金涌谈电池未来：半固态电池成过渡关键固态电池仍需持续攻坚

帕萨特ePro与途观L ePro双车上市，黄金超混加持，出行体验再升级！

奥迪E7X上市：以“标配即顶配”与L3级技术，重塑25万级豪华电动SUV格局

2026世界智能产业博览会亮点纷呈麒麟软件、蚂蚁科技等发布多项前沿成果

比亚迪璇玑A3芯片领航，全系车型可选装高阶智驾，开启安全出行新篇章

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.