滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

Moonshot AI联合清华推PrfaaS架构：解耦预填充解码，破局大模型算力瓶颈

时间：2026-04-21 19:20:55 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

大语言模型（LLM）的工业化应用正面临算力资源分配的挑战，而一项由国内科研团队提出的新型架构为破解这一难题提供了新思路。近日，Moonshot AI联合清华大学研究团队发布了一项名为“预填充即服务”（PrfaaS）的技术成果，通过重构传统推理流程，实现了跨地域算力资源的高效协同，显著提升了模型服务效率。

当前大语言模型的推理过程主要分为两个阶段：预填充阶段需完成输入文本的向量计算并生成键值缓存（KVCache），对计算资源需求极高；解码阶段则依赖内存带宽逐字生成输出，两者硬件需求差异显著。传统架构将这两个阶段强制捆绑在同一服务器或数据中心内处理，导致计算资源与带宽资源分配失衡，尤其在处理长文本时易引发服务拥堵。

PrfaaS架构的创新性在于将预填充与解码任务解耦。研究团队将计算密集型的预填充任务迁移至专用高算力集群，通过通用以太网将生成的KVCache实时传输至本地解码集群。这种设计使两个阶段可在不同地理位置的数据中心并行运行，彻底打破了物理空间限制。为保障传输效率，系统引入双时间尺度调度机制，既能根据实时流量动态调整资源分配，又通过精准路由算法确保长文本传输的稳定性，有效避免了资源竞争导致的延迟。

实际测试数据显示，该架构在多项核心指标上表现优异：服务吞吐量较传统方案提升54%，单位时间内可处理更多请求；用户端首字生成延迟显著降低，交互响应速度更快；通过分离计算、网络和存储子系统，资源利用率得到优化，传统架构中常见的拥堵问题得到根本性解决。这些改进使得大规模AI推理服务在保持低成本的同时，具备了更强的工业级部署能力。

这项成果不仅为优化现有数据中心算力分配提供了工程范式，更通过验证跨地域算力协同的可行性，为构建全球算力网络奠定了技术基础。其提出的“预填充即服务”模式，或将推动大语言模型从实验室研究向规模化商业应用的关键跨越。

更多>同类资讯

理想汽车5月交付量达33350辆，技术发布会将启全新L8月底登场

06-01

高通台北发布新品牌Dragonfly 2030年AI词元需求或迎爆发式增长

06-01

英伟达黄仁勋：Token成产业资产，NVIDIA DSX平台助力AI工厂建设

06-01

高通推出跃龙IQ10机器人参考设计，助力AI系统从原型到量产加速落地

06-01

鸿华先进与联发科携手，高阶车型搭载3nm C-X1芯片开启智能座舱新篇

06-01

英伟达携手宇树、Sharpa，推出基于Isaac GR00T的参考人形机器人

06-01

解散六年后卷土重来！OpenAI重建机器人团队奥特曼欲让机器人走进千家万户

06-01

扣子3.0上线：构建AI团队协作新架构，本地云端智能体携手共进

06-01

具身智能新赛道：启迪出海沙龙助力中国机器人扬帆全球市场

06-01

中国移动引领个人云服务变革：筑牢安全基石激活智能服务新动能

06-01

AI赋能数字经济新征程 2026数字经济大会共绘产业融合新蓝图

06-01

优云智算Agent社区上线，助力用户轻松创建专属“云端数字员工”

06-01

宇树一季报利润下滑，实则暗藏向具身智能平台进阶的“真利好”

06-01

浩思动力2026全球仿真技术日甬城启幕共探动力系统研发新路径

06-01

MG 4X上市：9.28万起开启技术平权，10万级纯电SUV市场迎新变革

06-01

点击查看更多 +

全站最新

交大医学院与华为共筑AI F5G-A全光校园：光智融合引领教育数智新未来

保时捷纯电版卡宴实车登场，融合经典与创新，开启电动豪华新篇章

大众帕萨特ePRO实车惊艳登场，引领混动领域迈向全新发展阶段

粤港澳车展聚焦：新尚界H5登场，16万起售搅动B级车风云

MG 4X上市：9.28万起开启技术平权，10万级纯电SUV市场迎新变革

一汽-大众35周年盛典启幕：以硬核科技与暖心服务，共赴智电新征程

热门内容

本栏最新

MG 4X上市：9.28万起开启技术平权，10万级纯电SUV市场迎新变革

MiniMax M3重磅登场：编码智能体顶尖，百万上下文原生多模态齐备

英伟达推出NVIDIA Isaac GR00T人形机器人整合多项技术助力研发提速

三十五载坚守与创新！一汽-大众油电并进，以体系实力领航智电新赛道

奥迪E7X携900V高压平台等黑科技登场，30万级纯电SUV市场要变天？

万洲电气凭WOES智能优化节能系统入列湖北工业软件企业名单引领节能新潮流

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.