滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

记忆张量携手商汤大装置：国产GPGPU集群实现推理成本反超A100

时间：2025-12-04 21:13:45 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

国产算力领域迎来重大突破——记忆张量科技有限公司与商汤科技大装置团队联合宣布，在国产GPGPU集群上成功部署全球首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群，并在真实生产环境中实现稳定运行。测试数据显示，该方案综合推理性价比达到同代英伟达A100的1.5倍，标志着国产算力体系首次在大模型商业化落地中展现出体系级竞争力。

这一突破源于对传统PD分离技术的深度重构。传统方案仅通过硬件隔离优化推理性能，但受限于物理架构，性能提升存在天然瓶颈。联合团队创新性地将PD分离从硬件优化升级为记忆中心的设计范式，通过记忆张量自主研发的MemOS系统，将大模型认知结构分解为参数记忆、激活记忆、明文记忆三类，构建起跨时间尺度的智能调度链路。系统能够精准判断计算任务的前移时机、保留策略及淘汰规则，使PD分离架构的潜力得到充分释放。

在具体实现层面，商汤科技大装置提供了底层支撑：其IaaS层高效算力池与智能调度系统为模型推理构建了稳定基础，Ignite框架通过多后端适配、KVCache优化等手段形成完整优化链路；算丰信息则负责集群算力管理，确保高性能GPGPU资源、存储及网络的高效协同。三方协作下，MemOS的记忆体系被映射为清晰的物理分工：Prefill域（P域）作为“记忆工厂”集中处理影子上下文预测与KV Cache预生成，Decode域（D域）则专注实时交互解码，两者通过高带宽互联实现跨节点KV Cache“即产即用”，传输开销降低超40%。

生产级评测数据验证了方案优势：在2k输入、1k输出、首字生成时间（TTFT）小于2秒的严苛条件下，集群整体吞吐量从107.85 tokens/s提升至189.23 tokens/s，增幅达75%；单卡并发能力从25.00提升至29.42，提升20%；TTFT全程稳定达标，Decode域因职责单一化避免了资源竞争。记忆张量技术负责人比喻称：“这相当于为高速算力通道配备了精密的交通指挥系统，使每个计算单元都能发挥最大效能。”

该成果的突破性在于实现了从技术优化到范式变革的跨越。传统PD分离仅关注硬件层面的计算任务分配，而联合方案通过MemOS将业务调度逻辑注入记忆单元，使推理过程从静态计算转向动态流水线。例如，在C端高并发场景中，系统可自动调整记忆保留策略，确保关键任务优先处理；在长文本生成场景下，激活记忆机制能动态平衡计算资源，避免性能衰减。这种设计使国产GPU不再局限于“能运行大模型”，而是具备承载R1级C端业务的完整体系能力。

基于此次实践，双方计划进一步拓展合作边界：一方面，将构建更大规模的记忆驱动流水线推理底座，整合影子上下文生成、多级缓存管理、AIOps监控等模块，形成可演进的基础设施体系；另一方面，将在Prefill行为预测自治化、跨任务长时记忆一致性等前沿领域展开探索，为具身智能、复杂任务编排等场景提供技术支撑。业内专家指出，这一突破标志着国产算力正从“参数计算”向“记忆计算”转型，有望在AI技术竞争中定义下一代推理范式。

更多>同类资讯

苹果或重启Vision Air开发，更轻薄头显预计2028年末至2029年登场

06-01

FF机器人5月出货69台超前两月总和推进多形态应用并举报非法做空

06-01

稀宇科技发布MiniMax M3模型：原生多模态加持，编程能力比肩国际顶尖水平

06-01

AI热潮助力软银市值飙升，二十余载首超丰田登顶日本股市

06-01

贾跃亭宣布FF EAI机器人5月出货69台，销售爬坡全年目标信心足

06-01

AI时代不必为专业选择焦虑人类创造力与情感联结才是核心竞争力

06-01

英伟达黄仁勋：AI非岗位“杀手” ，“有用AI”时代软件工程师需求正旺

06-01

深中通道西人工岛将迎全流程机器人智慧酒店 2027年初开启沉浸式文旅新体验

“未来我们会持续扩大智能服务应用范围：一方面不断升级机器人服务能力，拓展更多个性化、沉浸式科技体验；另一方面将智能系统与西岛整体文旅生态打通，实现登岛、游览、住宿、消费全链条智慧化，让科技无处不在、体验持续…

06-01

川渝科创盛会：脑机接口首秀机器人大赛规模创新高引青年逐梦

本次大赛采用线上线下紧密结合、同步办赛模式，全面考察选手机器人技术、人工智能算法、跨学科协作等综合能力，既保障赛事前沿创新性与现场观赏性，又充分调动大规模参赛群体的积极性。线上比赛方面，机器人创新赛、人工…

06-01

Anthropic推Claude Opus 4.8：强化诚实可靠，AI协作新挑战待解

按照惯例，发布会上少不了一串亮眼的跑分：SWE-bench Pro从64.3%升到69.2%，数学测试USAMO拿了96.7%，综合推理评分比GPT-5.5领先121个Elo分……但Anthropic选择把…

06-01

台积电新动向：AI芯片领域，能效提升成核心追求与关键突破点

这一变化也反映在台积电的制程技术规划中。预计即将到来的A14工艺相比N2工艺，性能可提升20%以上，同时功耗降低30%。A14将采用第二代GAA晶体管，并借助NanoFlex Pro技术进一步提高设计灵活…

06-01

Anthropic新推Claude Opus 4.8：聚焦诚实可靠，AI协作迎新思考

按照惯例，发布会上少不了一串亮眼的跑分：SWE-bench Pro从64.3%升到69.2%，数学测试USAMO拿了96.7%，综合推理评分比GPT-5.5领先121个Elo分……但Anthropic选择把…

06-01

AI大模型赛道再添猛将！MiniMax拟A股科创板上市开启“A+H”资本新征程

06-01

宇树科技今日科创板上会，拟募资超42亿，冲刺A股人形机器人第一股

06-01

MWC26上海首设“人形机器人点球大战”，8支顶尖战队角逐，见证AI竞技新突破

06-01

点击查看更多 +

全站最新

小米汽车交付量稳步攀升 5月再破3万产能释放助力全年目标冲刺

华为乾崑赋能全新猛士M817，以全能实力解锁智能越野新境界！

家庭出行新选择：东风奕派M8以智能与品质，引领大六座SUV价值新潮

问界M8斩获中保研超5G安全认证硬核防护与智能科技共筑安全新标杆

大众安徽直面市场：我是谁？有何优势？以真诚与实力深耕纯电市场

2026款一汽丰田普拉多怎么选？全能TX版性价比突出成首选

热门内容

本栏最新

三十五载坚守与创新！一汽-大众油电并进，以体系实力领航智电新赛道

奥迪E7X携900V高压平台等黑科技登场，30万级纯电SUV市场要变天？

万洲电气凭WOES智能优化节能系统入列湖北工业软件企业名单引领节能新潮流

6月车市盛宴来袭！5款SUV新车扎堆上市比亚迪大唐等热门车型谁更值得期待？

金涌谈电池未来：半固态电池成过渡关键固态电池仍需持续攻坚

帕萨特ePro与途观L ePro双车上市，黄金超混加持，出行体验再升级！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.