滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

NVIDIA推出KVTC技术：内存用量最高减20倍，AI硬件成本或大幅降低

时间：2026-03-23 03:02:14 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

大型语言模型（LLM）在处理长对话时，常因内存占用过高而面临性能瓶颈。NVIDIA研究人员近日提出一项名为KVTC（KV快取转换编码）的创新技术，通过高效压缩模型推理过程中的KV缓存，将内存需求最高降低20倍，同时无需修改现有模型架构。这一突破有望显著降低企业部署AI的硬件成本，并提升模型响应速度。

KV缓存是LLM的“短期记忆”，存储对话历史中的关键信息（Key和Value），使模型无需重复计算已处理内容。然而，随着对话长度增加，KV缓存可能膨胀至数GB，占用大量GPU内存，导致推理速度下降甚至系统卡顿。NVIDIA资深深度学习工程师Adrian Lancucki指出：“LLM推理的性能瓶颈通常不在计算能力，而在于GPU内存的有限性。传统方法需将闲置缓存转移至CPU或硬盘，但数据传输会引入额外延迟。”

KVTC技术借鉴JPEG图像压缩原理，通过“主成分分析、自适应量化、熵编码”三步流程，精准捕捉KV缓存中数据的高度相关性，剔除冗余信息。其“非侵入式”设计允许企业直接集成至现有系统，无需调整模型代码或参数。实验数据显示，在参数量从15亿至700亿的模型（如Llama 3系列、R1-Qwen 2.5）中，KVTC将内存压缩20倍后，模型准确率损失不足1%，而传统方法仅压缩5倍便会导致显著性能下降。

在H100 GPU的实测中，处理8000个Token的提示时，启用KVTC后模型首次响应时间从3秒缩短至380毫秒，提速达8倍。这一优势在编程助手、迭代式推理等长对话场景中尤为突出，而短对话场景因缓存规模较小，压缩效果相对有限。

NVIDIA计划将KVTC整合至Dynamo框架的KV块管理器，并兼容vLLM等主流开源推理引擎。业内分析认为，随着LLM对话长度持续增加，标准化压缩技术或将成为AI落地的关键基础设施，其普及程度可能类比于视频压缩技术对多媒体行业的影响。

更多>同类资讯

CET中电技术赋能玉门油田：创新电碳系统引领行业绿色转型新路径

04-27

全新尼桑NOTE来袭，混动引擎动力强劲，或成飞度有力竞争者

04-27

宝济药业-B创历史新低

04-27

尚水智能创历史新低

04-27

港股异动丨芯片股表现强势，中芯国际涨超7%，资金重新聚焦于AI相关需求的持续激增

04-27

国家能源局：预计2026年全国最大电力负荷在15.75亿至16亿千瓦之间

04-27

是否给台积电供货？博杰股份：公司与该客户暂无直接业务合作

04-27

韩国政府开始向七成国民发放“高油价补贴”

04-27

巴克莱：美联储本周预计按兵不动，但年内仍可能降息

04-27

天华新能创历史新高

04-27

机构：日本央行应预防性加息以锚定通胀预期

04-27

宁波大学团队在钙钛矿光伏物理领域取得新突破

04-27

国家发改委：到2030年，西藏森林覆盖率达12.61%以上

04-27

科创50指数涨超4%

04-27

菲律宾维持新建煤电项目禁令拒绝因能源风险松绑

04-27

点击查看更多 +

全站最新

丰田纺织2026北京车展：以创新科技诠释移动空间新“和鸣”与舒适体验

欣旺达北京车展秀实力：“欣星环”电池发布，“能量家生活馆”引领新能源生活

吉利第5代帝豪i-HEV智擎混动北京车展首秀动力节能安全全面升级

神州租车携手长安汽车交付多款新车全力护航五一假期出行体验升级

耐世特EMB北京车展闪耀登场，全栈式技术赋能高阶自动驾驶新未来

爱尔铃克铃尔2026北京车展展实力：聚焦新能源，共筑汽车技术新未来

热门内容

本栏最新

全新尼桑NOTE来袭，混动引擎动力强劲，或成飞度有力竞争者

港股异动丨芯片股表现强势，中芯国际涨超7%，资金重新聚焦于AI相关需求的持续激增

科创50指数涨超4%

盘中首次突破4万点大关！台股收盘再创历史新高，年内累涨36.78%

A股异动丨恒宝股份跌逾6% 股价创逾10个月新低

A股异动丨同兴达一度逼近跌停一季度净亏损4257.82万元

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.