滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

华为SINQ量化技术发布：大语言模型显存需求直降60%至70%

时间：2025-10-06 09:46:25 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

华为苏黎世计算系统实验室近日宣布推出一项革命性的开源量化技术——SINQ（Sinkhorn归一化量化），该技术专为优化大语言模型（LLM）的硬件资源利用而设计。通过创新性的压缩算法，SINQ显著降低了模型运行所需的显存空间和计算成本，为人工智能领域的高效部署提供了新方案。

实验室测试数据显示，SINQ技术对不同规模的大语言模型均展现出强大的压缩能力。在保持模型性能的前提下，显存占用可减少60%至70%。例如，原本需要超过60GB显存才能运行的复杂模型，经SINQ优化后仅需约20GB显存即可部署，大幅降低了硬件门槛。

这项技术的突破性在于其归一化量化机制，通过Sinkhorn算法对模型权重进行高效重构，在压缩过程中最大程度保留了原始模型的信息密度。与传统的量化方法相比，SINQ不仅减少了资源消耗，还维持了模型的推理精度，为大规模语言模型的商业化应用开辟了新路径。

目前，SINQ已作为开源项目对外发布，研究人员和开发者可自由获取相关代码并应用于实际场景。随着人工智能模型规模持续扩大，这项技术有望缓解高算力需求带来的硬件压力，推动更高效的AI系统落地。

更多>同类资讯

西部数据CEO：不扩产能靠技术提量，AI与监控成存储需求“双引擎”

03-05

美光256GB SOCAMM2送样：高容量低功耗，为AI及HPC内存解决方案赋能

03-05

英特尔战略转向？陈立武松口，18A制造技术或对外开放代工

03-05

内存市场供应紧张！南亚科技称HBM产能消耗大紧缺或延续至2028年

03-05

马蜂窝《2026人工智能+旅游趋势报告》：AI重塑旅游，十大趋势引领未来新体验

03-05

51Sim以53.5%市占率领跑，高阶智驾仿真迈入“验证能力竞争”新阶段

03-05

鲁大师2月电动两轮车榜单揭晓：九号小牛领跑，智能化成竞争新焦点

03-05

Apple Music拟推AI透明度标签，要求发行商主动标记人工智能内容

03-05

OpenAI 发布 Windows 版 Codex，160万开发者已抢先体验

03-05

OpenAI选定律师事务所筹备IPO，估值达7300亿美元最早今年上市

03-05

宇树开源OmniXtreme人形机器人架构，流匹配技术攻克高动态动作难题

03-05

技术破局与商业双轮驱动，MiniMax向AI平台型公司加速跃迁

03-05

荣耀获邀登MWC主舞台 CEO：将创造“很酷的AI未来”

03-05

特斯拉计划就大幅提升AI6芯片产能规模与三星电子磋商

03-05

黄牛加剧全球DDR5内存短缺，机器人每小时发起超5万次请求

03-05

点击查看更多 +

全站最新

小米汽车10天万公里行驶引争议阿维塔智驾冠军车主晒成绩力证其可行性

科大讯飞维权再传捷报：自媒体及直播间侵权多案胜诉获赔总额近40万

A股异动丨政府工作报告提“加快智能电网建设”，相关概念股走强，中国西电等多股涨停

A股脑机接口股强势，南京熊猫、岩山科技涨停，政府工作报告提培育发展脑机接口等未来产业

港股异动丨脑机接口股大涨，南京熊猫电子股份飙升超23%

华为896线激光雷达发布！智能驾驶"高线数时代"来临

热门内容

本栏最新

鲁大师2月电动两轮车榜单揭晓：九号小牛领跑，智能化成竞争新焦点

华为杨超斌MWC26演讲：5G-A加速商用，携手产业共迎智能世界新机遇

乐聚机器人携手德国舍弗勒共绘人形机器人工业应用新蓝图

临阁能源获数千万元天使轮融资，聚焦阳台储能推动家庭用电低碳化

Qwen负责人林俊旸离队关联公司上海智信普惠今年初现人员变更

地平线HSD赋能iCAR V27，硬派SUV智驾革新，开启出行新体验

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.