滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

NVIDIA推出KVTC技术：内存缩减20倍，长对话推理成本与速度双优化

时间：2026-03-22 19:17:20 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

大型语言模型在处理长对话时，常面临内存不足的瓶颈，这一问题不仅制约模型性能，还显著增加了企业部署AI的硬件成本。NVIDIA研究人员近期提出一项名为KVTC（KV快取转换编码）的突破性技术，通过压缩模型对话历史所需的KV缓存，将内存占用最高降低20倍，同时实现首次回应生成速度提升8倍，且无需修改现有模型架构。

KV缓存作为模型的“短期记忆”，在对话处理中扮演关键角色。当模型与用户交互时，会将对话中的关键信息（Key和Value）存储为缓存，避免重复计算整段对话，从而提升响应效率。然而，随着对话长度增加，缓存数据可能膨胀至数GB，占用大量GPU内存，反而导致计算效率下降。NVIDIA资深深度学习工程师指出，模型推理的性能瓶颈往往不在算力，而在于GPU内存的有限性——传统方法需将闲置缓存转移至CPU或硬盘，引发数据传输延迟和额外成本。

KVTC技术的核心创新在于借鉴JPEG图像压缩的思路，通过“主成分分析、自适应量化、熵编码”三步流程，高效压缩KV缓存。与传统压缩方法不同，该技术针对缓存数据高度相关的特性，在保留关键信息的同时剔除冗余内容，且支持分块、逐层解压，确保模型实时响应不受影响。实验数据显示，在参数量从15亿到700亿的模型（包括Llama 3系列、R1-Qwen 2.5等）中，KVTC即使将内存压缩20倍，模型准确率损失仍低于1%，而传统方法仅压缩5倍便会出现显著性能下降。

以H100 GPU处理8000个Token的提示为例，未使用KVTC时模型需3秒生成首个回应，启用后仅需380毫秒，速度提升达8倍。这一特性使其尤其适用于编程助手、迭代式推理等长对话场景，而在短对话中压缩效果相对有限。技术团队强调，KVTC采用“非侵入式”设计，企业无需调整模型代码即可快速部署，进一步降低了应用门槛。

目前，NVIDIA正推动KVTC与主流开源推理引擎的兼容，计划将其整合至Dynamo框架的KV块管理器中，以支持vLLM等工具的无缝调用。随着大型语言模型对话能力的持续增强，标准化压缩技术或将成为降低AI部署成本的关键路径，为更广泛的行业应用提供技术支撑。

更多>同类资讯

山西汾酒一季度净利润53.83亿，存货减少7.42亿显主动调整战略

04-29

80后投资人热议：AI浪潮下，如何以“锐力与钝力”捕捉投资新机遇？

04-29

第一创业2025年增收不增利，资管业务亮眼，北交所3单IPO中止引关注

04-29

多重因素共振启涨，储能电池ETF易方达(159566)涨近4%，年内流入超33亿元

04-29

ETF风向标 | A股重返4100点，稀土与新能源板块大爆发，稀有金属ETF涨超7%

04-29

龙虎榜 | 温州帮狂甩固德威近1亿，瑞鹤仙抢筹德方纳米超6600万

04-29

交通银行：Q1净利261.62亿元，同比增3.1%

04-29

农业银行：Q1净利751.85亿元，同比增4.52%

04-29

天威视讯：一季度净亏损2154.02万元

04-29

欧盟主席：美伊冲突60天燃料进口支出增270亿欧元

04-29

吉林敖东：Q1净利8.66亿元，同比增67.56%

04-29

川能动力：Q1净利2.67亿元，同比增12.65%

04-29

领益智造：Q1净利3.92亿元，同比下降30.7%

04-29

风神股份：Q1净利5090.57万元，同比增80.36%

04-29

山东黄金：Q1净利14.46亿元，同比增40.87%

04-29

点击查看更多 +

全站最新

FBIF2026盛大启幕，全球食品精英齐聚杭州共谋创新发展新路径

2026款212 T01检阅官降价3000元，越野配置升级，舒适科技配置有增有减

2026北京车展：长城魏牌携AI旗舰与归元平台开启豪华汽车新征程

MG品牌双车齐发：2026款MG4加码性价比，MG 07携高阶智驾重塑轿跑格局

2026海外网红营销必看：7大社媒平台特性解析与ROI最大化策略

Momenta R7量产首发：物理AI赋能智驾，中国方案引领全球新格局

热门内容

本栏最新

多重因素共振启涨，储能电池ETF易方达(159566)涨近4%，年内流入超33亿元

ETF风向标 | A股重返4100点，稀土与新能源板块大爆发，稀有金属ETF涨超7%

龙虎榜 | 温州帮狂甩固德威近1亿，瑞鹤仙抢筹德方纳米超6600万

中国人寿：Q1营收同比下降15.3%，净利同比下降32.3%

长飞光纤：Q1净利同比增长226.4%、环比增长43%

三峡能源：2025年净利润37.14亿元同比下降39.20%

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.