滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

智谱联合清华等推ZCube架构：GPU推理性能跃升网络成本降三成

时间：2026-05-21 11:22:45 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能基础设施领域，一场由网络架构创新引领的变革正在悄然发生。随着大模型推理对硬件性能的要求日益严苛，如何突破传统网络架构的瓶颈，成为行业关注的焦点。近期，一项名为ZCube的新型网络架构研究成果引发广泛关注，其成功落地标志着智算基础设施发展迈入新阶段。

传统网络架构在应对长上下文推理与Prefill-Decode分离部署时，逐渐暴露出明显短板。基于多层交换机堆叠的ROFT架构因静态拓扑特性，在KV Cache跨节点传输高度不对称的场景下，极易引发局部热点与PFC反压问题。这种"总带宽充足却局部频繁拥塞"的现象，严重制约了GPU集群的推理效率与资源利用率。

ZCube架构的突破性在于彻底重构了网络拓扑设计。研发团队摒弃了传统的Clos层次化堆叠思路，创新性地采用完全扁平化的两组交换机二部图互联方式。通过取消Spine层交换机，配合双端口网卡实现的单/多轨混合接入机制，构建出独特的流量传输通道。这种设计确保任意两个GPU节点间都存在独享的最优路径，从根本上解决了负载均衡难题。

在GLM-5.1coding生产环境的实践中，ZCube架构展现出显著优势。基准测试数据显示，在保持GPU硬件、软件栈及应用模式不变的情况下，该架构使交换机与光模块的资本支出降低33%，GPU平均推理吞吐量提升15%，首Token时延（TTFT P99）更是大幅下降40.6%。这些数据印证了其兼顾经济性与高性能的系统级突破能力。

技术落地的背后是严谨的工程实践。驭驯网络团队开发了自动化控制与校验工具，成功攻克布线重构与路由策略调整等关键挑战。在千卡集群的升级过程中，通过精密的流量调度与实时监控，确保了系统在两周以上的稳定运行，为超大规模GPU集群的平滑扩展提供了可靠范本。

这项创新不仅改变了网络架构的设计范式，更推动智算基础设施向模型流量驱动的系统协同方向演进。当网络拓扑、通信库与调度策略形成深度耦合，Token生产效率与MaaS综合成本的优化将获得新的突破口。随着行业对推理性能要求的持续提升，ZCube架构的实践价值正在得到越来越多验证。

更多>同类资讯

AI改写亲密关系：万元到百万元的伴侣机器人，能填补人类情感缺口吗？

07-05

安波福多管齐下应对芯片难题：全球调配资源优化架构降依赖

07-05

北京人形机器人创新中心响应倡议：以科技向善引领产业高质量发展

07-05

文物安全新守护者！国内首颗文物遥感卫星升空开启智能监测新篇

卫星核心工作并非直接探测地下文物，而是持续监控文物保护区周边环境变化，监测内容覆盖四大板块：一是盗掘、违规施工等人为破坏活动；二是滑坡、沉降、风沙水蚀等自然地质灾害；三是能够反映人为扰动的植被异常区域；四是…

07-05

银行业AI转型加速：大行稳进、股份行竞速、民营行深耕小微普惠

07-05

安波福多管齐下应对芯片紧缺：优化架构、双轨备份保汽车供应链稳定

07-05

预售来袭！领克07GT高颜值猎装，408马力起，续航破千，配置超丰富

07-05

两协会联合倡议：以科技向善引领情感陪伴人形机器人健康发展

据央视新闻7月4日消息，中国人形机器人百人会和中国机械工业联合会今天联合发布关于规范和引导情感陪伴人形机器人发展的倡议，提倡共同践行科技向善、推动机器人产业健康发展。记者了解到，当前，我国人形机器人产业加速…

07-05

vivo X300e完成备案：6.6英寸屏配骁龙8 Gen5 蔡司三摄7000mAh电池亮点足

7月4日消息，vivo X300e已经备案，3C认证显示其支持90W快充，该机将在暑期档发布。博主智慧皮卡丘爆料称，该机将采用6.6英寸的中尺寸屏幕，背部配备矩形Deco，预计是类似S60系列的造型。影像…

07-05

北京大学领衔！全球首款忆阻器神经动力学芯片问世运算速度大幅提升

IT之家 7 月 4 日消息，北京大学集成电路学院官方公众号昨日（7 月 3 日）发布博文，宣布联合发布全球首款基于可控存内计算的忆阻器神经动力学芯片，首次将神经动力学系统的单步运算时延压缩至 2.12 毫…

07-05

Jabra再推三款Evolve3专业耳机：精准适配多场景，AI赋能办公新体验

通话中主动降噪 (ANC) 是另一项显著优势：与主要针对聆听时的专注力的传统 ANC 不同，Evolve3 耳机在通话期间专门应用 ANC 功能，降低佩戴者的背景噪音，并结合侧音监测，保持语音音量自然，减少…

07-05

3500余青少年齐聚成都西南赛区航天创新大赛圆满收官展青春风采

07-04

2026全国青少年航天创新大赛西南赛区落幕青少年逐梦航天展风采

07-04

宇树科技陈立：核心零部件自研自产，机器人出货量领先，产品性价比居行业高位

07-04

北大领衔突破！全球首款忆阻器神经动力学芯片问世运算提速最高478倍

07-04

点击查看更多 +

全站最新

武汉新能源车主必看！选靠谱汽车服务门店的三大黄金维度来了

法拉利线控手动挡：为燃油车保留驾驶乐趣，或成平民燃油车新选择

特斯拉新动态：APP更新带来车辆模型新渲染，OTA更新何时再至？

领克20升级激光雷达亮相，运动外观搭配智能科技，三季度上市引期待

漫画风涂装经典车现身彼得森博物馆，二维质感带来超现实视觉盛宴

宝马全新iX7谍照流出！外观内饰大升级，BBA大型跨界SUV再添猛将

热门内容

本栏最新

安波福多管齐下应对芯片紧缺：优化架构、双轨备份保汽车供应链稳定

预售来袭！领克07GT高颜值猎装，408马力起，续航破千，配置超丰富

通信网络新变革：AI赋能，Token驱动，开启智能时代新篇章

魏县特种车辆零部件集群“共享智造”：降本增效助力企业“抱团”发展

iCAR V27大版本OTA升级：HSD V2.0赋能，智驾座舱全面进化

零跑B10新动作来袭！官宣新车色，配置亮点与价格信息一览

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

智谱联合清华等推ZCube架构：GPU推理性能跃升 网络成本降三成

智谱联合清华等推ZCube架构：GPU推理性能跃升网络成本降三成