滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

华为云Tokens服务性能飞跃：全面接入384超节点，吞吐量飙升至2400TPS

时间：2025-08-27 20:41:01 来源：ITBEAR编辑：快讯 IP：北京 发表评论无障碍通道

在第四届828 B2B企业节盛大开幕之际，华为云宣布了一项重大进展：其Tokens服务已成功整合至CloudMatrix384超节点系统。通过引入创新的xDeepServe架构，该系统在单芯片上实现了前所未有的性能突破，达到2400TPS的交易处理速度及50ms的超低时延，远超当前行业标准。

面对中国AI算力需求的爆炸式增长，华为云凭借其独特的“综合优势”，正系统性地构建强大的计算能力。数据显示，从2024年初至今年6月底，中国日均Token消耗量从1000亿激增至30万亿，这一300多倍的增长不仅彰显了AI应用的迅速扩张，也对算力基础设施提出了更高要求。

今年3月，华为云推出了基于MaaS（模型即服务）的Tokens服务，该服务不仅提供了多种计费模式，还根据应用场景和性能需求，推出了在线版、进线版、离线版及尊享版等多种服务方案。这一创新举措为大模型和智能体等AI工具提供了更加灵活、经济高效的算力支持。

此次，Tokens服务的全面接入CloudMatrix384超节点，标志着华为云在算力领域迈出了关键一步。借助384超节点的原生xDeepServe框架，系统吞吐量从年初的1920TPS跃升至2400TPS，同时保持了50ms的低时延。这一成就得益于从硬件到软件、从算子到存储、从推理框架到超节点的全方位技术创新。

CloudMatrix384超节点通过革新计算架构，打破了性能瓶颈，为澎湃算力奠定了坚实基础。而CANN（昇腾计算架构）硬件使能技术，通过优化算子和通信策略，确保了云端算力的高效调度与组合。EMS弹性内存存储技术打破了AI内存墙，实现了“以存强算”，充分释放了芯片潜能。xDeepServe分布式推理框架则通过Transformerless架构，将大模型拆解为可独立扩展的微模块，实现了超高效算力。

xDeepServe的极致分离架构，如同将大模型拆解为“积木”，分派至不同NPU同步处理，再通过高性能通信库XCCL和自研推理引擎FlowServe重新组合，构建了一条超高速的Tokens处理流水线。这一创新不仅提升了单卡吞吐量至2400tokens/s，还为AI推理的线性扩展提供了可能。

作为硬件加速的中间层，CANN包含了算子库和高性能通信库XCCL等组件，共同支撑了AI模型的高效运行。XCCL专为超节点上的大语言模型（LLM）服务设计，充分利用了CloudMatrix384的UB互联架构潜力，为Transformerless架构的全面分离提供了坚实的硬件基础。

FlowServe引擎则采用了“去中心化”设计，将CloudMatrix384切割为完全自治的DP小组，每个小组具备完整的处理能力，确保了即便在千卡并发的情况下也能保持流畅运行。

在模型支持方面，华为云MaaS服务已涵盖了DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型，以及versatile、Dify等主流Agent平台。通过大量的模型优化和技术积累，华为云实现了“源于开源，高于开源”的目标，使得大模型在昇腾云上能够更快、更好地运行。

以文生图大模型为例，华为云通过量化技术和算子融合，在轻微牺牲画质的前提下，实现了两倍于业界主流平台的出图速度，并支持最大2K×2K尺寸。在文生视频大模型方面，通过量化和通算并行等技术，大幅降低了延迟和显存占用，实现了3.5倍的性能提升。

在应用层面，华为云已与超过100家合作伙伴携手，深入行业场景，共同开发了丰富的Agent应用。这些应用涵盖了调研分析、内容创作、智慧办公、智能运维等多个领域，有效解决了产业难题，加速了企业的AI创新进程。

例如，基于MaaS平台推出的今日人才数智员工解决方案，集成了先进的NLP、机器学习和深度学习技术，实现了智能交互和任务处理，显著提升了服务效率与客户满意度。而北京方寸无忧科技开发的无忧智慧公文解决方案，则通过智能化手段提升了公文处理效率，推动了政企办公的智能化转型。

更多>同类资讯

AI教育应用崛起：互联网与教育大厂谁能率先抢占市场红利？

10-17

商汤与寒武纪“算法+算力”携手，共筑国产AI生态发展新路径

10-17

Figma CEO：AI并非取代人类，60%受访者称AI助其聚焦高价值工作

10-17

数智赋能、需求导向、立足本土：探索中国特色服务型制造发展新路径

10-17

三七互娱ESG实践：以创新融合之姿，开拓可持续发展新路径

10-17

易邮快递超市：跨企业技术协同，构建物流电商高效服务新生态

10-17

阿里巴巴布局具身智能赛道，投资穹彻智能加速“具身大脑”多场景落地

10-17

字节跳动海外推出“Dreamina AI”，功能全面覆盖创意全流程，市场表现可期

10-17

OpenAI揽入黑洞理论物理学家Lupsasca，发力前沿科学探索新征程

10-17

DeepMind携手CFS能源：AI赋能核聚变控制，加速“人造太阳”商业化步伐

10-17

工程师拆解ChatGPT测试版APK：发现私信功能代码，或跨界社交领域

10-17

科技领航电力变革：“大瓦特”赋能贵州电网，绘就智能用电新画卷

作为我国电力行业首个自主研发的行业大模型，南方电网“大瓦特”已在贵州落地40个应用场景，覆盖电力生产、调度、服务全链条，成为推动贵州电网公司能源数字化转型的核心引擎，让贵州省用户享受到更可靠、更智能的用电服…

10-17

阿里巴巴加码具身智能赛道，投资穹彻智能加速“具身大脑”多场景落地

为此，穹彻智能在关键技术领域取得一系列进展突破，最新研发成果包括无本体数据采集方案、通用端到端模型方案以及人机协作的规模化部署系统，正致力于打通从数据到部署的全链路，贯穿从数据采集、模型预训练到后训练的完整技…

10-17

IROS 2025十月登陆杭城，共探人机协作前沿，开启机器人领域新篇章

本届大会将于10月19日至25日在杭州国际博览中心召开，大会以“人机协作前沿”为核心议题，围绕 “人机协作前沿” 核心议题，将设置技术会议、成果展览、专题论坛、产业对接等多元活动，预计吸引全球6000余名顶…

10-17

数智领航黔西南州能源转型：以创新之笔绘就绿色发展新图景

从智能煤矿建设到能源专网全覆盖，从无人机智能巡检到新型电力系统构建，黔西南州以数字化、智能化技术为双翼，驱动能源产业向更安全、更高效、更绿色的方向转型升级。从地下矿山的智能化改造，到天地空一体化的智慧电网，…

10-17

点击查看更多 +

全站最新

雷军2025智能网联汽车大会发声：行业协同破局，筑牢安全质量创新基石促发展

小米汽车交付破40万，57.9亿投入组合辅助驾驶，1800人团队助力智能出行

小米SU7事故敲响安全警钟：车门隐患与电池风险，新能源汽车安全路在何方？

雷军新疆曝路试动态，小米首款增程SUV能否在高端混动市场闯出一片天？

雷军造车遇困局，刘强东布局汽车生态：新能源赛道两种发展路径大碰撞

雷军成都事故后首度发声：智能网联汽车需共建生态，小米愿携手行业破局突围

热门内容

本栏最新

小米与北大联合论文现“天才少女”罗福莉之名，其职业轨迹与千万年薪传闻引关注

2025百度世界大会11月13日启幕，年度盛会共探技术新趋势

截至10月11日，上海累计完成119款生成式AI服务登记，新增5款

截至2025年10月9日北京市新增3款生成式AI服务累计备案达161款

清华物理才子姚顺宇告别Anthropic，携所学投身谷歌DeepMind开启新征程

占地1300平方米！智元机器人全国首家具身智能体验中心落地无锡

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.