滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

谷歌发布TurboQuant压缩算法，无需重训模型实现键值缓存约6倍内存缩减

时间：2026-03-26 15:01:04 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能技术持续突破的背景下，内存占用问题正成为制约大模型应用的关键瓶颈。谷歌近期宣布推出一项名为TurboQuant的压缩算法，该技术通过优化数据存储结构，有效缓解了AI系统运行中的内存压力，尤其针对大语言模型和向量搜索引擎的存储需求提供了创新解决方案。

研究团队聚焦于AI系统中的键值缓存机制——这一组件负责存储模型推理过程中高频调用的中间数据。随着上下文窗口扩展至数万token级别，传统缓存方案的内存消耗呈指数级增长，逐渐成为制约系统效率的核心矛盾。TurboQuant通过突破性的量化压缩技术，将缓存数据的存储精度从行业常规的16位降至3位，在保持模型输出质量的前提下，实现了存储空间的显著优化。

技术验证环节覆盖了多个主流开源模型，其中对Gemma系列模型的测试数据显示，采用TurboQuant后键值缓存的内存占用减少约83%，相当于原有空间的六分之一。这项突破特别体现在其"零干扰"特性上：压缩过程无需对模型参数进行任何调整，既避免了耗时的重新训练流程，也确保了推理结果的准确性不受影响。该特性使得现有AI系统能够无缝集成这项新技术，大幅降低升级成本。

据技术文档披露，TurboQuant的核心创新在于动态精度分配机制。系统会根据数据访问频率自动调整存储精度，对高频访问数据保持较高精度，而对低频数据实施深度压缩。这种差异化处理策略在保证关键信息完整性的同时，最大限度释放了存储资源。目前该技术已开放技术白皮书，供全球开发者评估其在不同应用场景中的适配性。

更多>同类资讯

2025年国内消费级AI/AR市场销量大增109%，雷鸟领跑各品牌齐发力

03-26

字节跳动关联公司登记“抖省省”logo著作权旗下团购App主打优惠省钱

03-26

百度布局漫剧领域：登记“百度漫剧LOGO”著作权还将上线“柚漫剧”APP

03-26

雷军辞任金山云非执行董事关联超60家存续企业涉多领域

03-26

在虚实交织的人机恋里：一位女性用“选择”赋予AI专属温度

03-26

小米汽车回应动力差异：试驾车设新手保护期，车模玩偶补货时间公布

03-26

苹果谷歌AI合作再添新料：深度访问Gemini模型，自研之路亦未停歇

03-26

法官“爱心点赞”引争议，马斯克团队申请其回避特斯拉诉讼案

03-26

xAI联合创始人接连离职，马斯克AI公司仅剩一“元老”相伴，组织架构动荡

03-26

商汤5年巨亏357亿背后：减员3641人“降本”，技术竞争隐忧待解

03-26

AI短剧崛起浪潮下：短剧演员面临失业危机，行业格局生变

03-26

老头乐企业挑战小米汽车外观专利今日现场口审车型相似引关注

03-26

WPS全球月活达6.78亿创新高雷军祝贺团队产品创新与全球化突破

03-26

王腾护雷军“雷区”：禁止网友调侃，离职后仍显敬重老东家掌舵人

03-26

谷歌安卓新规重塑应用生态：第三方商店与小众工具面临分发新挑战

03-26

点击查看更多 +

全站最新

台股收跌0.3%

A股智能电网股集体下跌，顺钠股份、金利华电跌超8%

A股保险股集体下跌，中国人寿跌超5%

A股异动丨电力股继续集体上涨，晋控电力、华电辽能等多股涨停

港股异动丨保险股下挫中国人寿绩后大跌超8% 创去年11月初以来新低

A股异动丨Q4利润暴跌，华工科技一度大跌超8%

热门内容

本栏最新

程一笑再论竞争：可灵AI加速进化，快手2026年AI投入与增长双提速

鸿蒙向下渗透，汽车矩阵补全，华为新品能否撬动新市场？

REDMI Note 15 SE 4月2日印度登场红色仿皮革后盖配金色边框引期待

小米汽车深陷专利风波：山东小厂对其前大灯及保险杠设计发起无效挑战

小米新一代SU7磁吸玩偶成爆款！79元定价受热捧官方紧急补货满足需求

新一代小米SU7首批交付获赞：颜值吸睛，智能操控续航样样出众

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.