滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

二手硬件显神威：6根傲腾内存助力单GPU工作站运行万亿参数大模型

时间：2026-05-25 03:39:51 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近日，科技领域传来一则引人注目的消息：一名Reddit用户APFrisco凭借独特的硬件组合与软件优化方案，在单GPU工作站上成功运行了参数规模达1万亿的Kimi K2.5大模型，推理速度稳定在每秒4个Token。这一成果为高参数模型在有限硬件环境下的部署提供了新思路。

该系统的核心硬件配置颇具特色。处理器采用英特尔至强金牌6246，搭配泰安S5630GMRE-CGN主板构建计算平台。内存系统由两部分组成：6根32GB三星DDR4-2666 ECC内存条提供基础内存容量，6根128GB英特尔傲腾DCPMM持久内存模块则作为扩展存储，两者协同工作使总内存容量达到768GB。图形处理任务由两张华硕GeForce RTX 3060 OC 12GB显卡共同承担，存储设备选用西部数据WD SN850X 2TB固态硬盘，电源系统采用华擎Steel Legend SL-850G 850W全模组电源确保稳定供电。

软件层面的优化是该方案的关键突破。研发团队基于llama.cpp框架开发了GPU与CPU混合推理方法，通过设置override-tensor标志，将模型路由组件强制分配至GPU显存处理。由于两张显卡共提供24GB显存，系统巧妙地将核心计算任务集中于此，而将剩余参数存储于傲腾内存模块中。这种设计有效解决了单卡显存容量不足的瓶颈问题，使大规模模型能够在消费级硬件上运行。

英特尔傲腾系列产品的技术特性在此方案中发挥重要作用。尽管该产品线已停止生产，但其独特的持久化内存特性——读写速度介于传统DRAM与固态硬盘之间——使其成为替代高成本内存方案的理想选择。傲腾模块不仅能够提供大容量存储空间，还能保持相对较高的数据访问速度，这种中间层特性恰好满足了大模型推理过程中对内存容量与速度的双重需求。

行业观察人士指出，随着CXL计算快速连接标准的逐步成熟，内存架构将迎来新的发展机遇。这项标准通过统一内存访问接口，能够实现CPU、GPU与加速卡之间的内存池化共享，为构建高性价比的大容量内存解决方案提供技术基础。未来，这类技术有望缓解大型语言模型训练与推理过程中对内存容量的迫切需求，推动AI应用向更广泛的硬件环境普及。

更多>同类资讯

豆包大模型2.1跨越生产级质变点，AI赋能产业开启效率革命新篇章

豆包大模型2.1不仅拥有最聪明的“大脑”，还长出了智能体的“手臂”，用户最大的感触就是——AI替我干活终于可靠了。 AI蓝媒汇体验了豆包大模型2.1的Agent能力，向其提出要求：“帮我制作一份《桃花源记》…

06-29

翁荔最新长文深度剖析：AI行业奉为圭臬的缩放定律，应用需谨慎

从 Kaplan 与 Chinchilla 的分歧，到数据受限条件下的新模型，再到 Besiroglu 对拟合过程的重新复现，她不断强调一个事实：缩放定律的预测能力，很大程度上依赖于模型参数如何定义、损失函数…

06-29

豆包大模型2.1跨越生产级质变点，AI赋能产业开启高效增长新篇章

豆包大模型2.1不仅拥有最聪明的“大脑”，还长出了智能体的“手臂”，用户最大的感触就是——AI替我干活终于可靠了。 AI蓝媒汇体验了豆包大模型2.1的Agent能力，向其提出要求：“帮我制作一份《桃花源记》…

06-29

AI大模型告别野蛮生长：通用红利消退，垂直深耕与精细运营成新趋势

训练千亿参数基座模型需要海量算力、优质标注数据与持续资金投入，单轮完整训练成本动辄数亿，中小科技企业很难长期承担资金消耗。未来 AI 赛道的核心机会集中在三层：一是面向实体产业的垂直模型定制服务；二是轻量化边…

06-29

华为携手中国电信及行业伙伴，共筑智能体互联网新生态，推动AI体验升级

在近日由华为联合中国电信主办的“升级智能化网络，打造可保障连接，共筑Token优质体验”高峰论坛上，中国基金报记者获悉当前AI产业正式迈入规模化落地阶段，交互体验成为各类智能服务的核心竞争力。华为ICT M…

06-29

上海移动5G-A超级上行网络：以丝滑体验为笔，绘就AI时代商业新蓝图

过去，主播大多在室内固定场景直播；如今，越来越多主播走进景区、展馆、演唱会、体育赛事现场，希望将第一视角的内容实时分享给观众。例如，前文提到的高清直播、AI看展等体验场景，背后都离不开超级上行体验保障产品的…

06-29

华为杨扬：借AI之力焕新通信服务，携手伙伴共拓Token经营新蓝海

在重点行业市场，依托低时延无损的算力互联能力，推动算网一体化深度融入生产制造、医疗教育、交通巡检等各类行业场景，让算力资源真正成为驱动产业升级的核心动力。面向未来，Token经营仍处在持续探索完善的阶段，华…

06-29

《玩具总动员5》上映10天票房破2亿，时隔七年回归直击时代新议题

06-29

古尔曼爆料：苹果Mac Studio更新计划曝光，M5 Ultra芯片款今年或登场

06-29

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

06-29

数据中心扩张带动需求，三菱重工燃气轮机扩产应对74台积压订单

06-29

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

06-28

东风奕派M8正式开启预售！19.98万元起享大六座SUV与华为黑科技

06-28

DeepSeek新突破：DSpark如何实现推理速度与效率双提升？

06-28

法拉第未来发布Faber轮臂机器人及Futurist人形机器人拓展工业与商用新场景

06-28

点击查看更多 +

全站最新

张毅：从硅谷到苏州，以AI算法赋能供应链，书写科技报国新篇章

捷迅AI+农业亮相链博会AI专区与英伟达等巨头同台共绘产业新篇

Meta开源Astryx：八年磨一剑，用JSON清单为AI前端开发立新规

小米YU7年销24.4万辆月均2.03万，细分赛道称王，离全民神车还有多远？

高校禁入小米汽车引争议：规则透明性合理性受拷问，管理能否多点章法？

启境GX7智能五座SUV官图亮相，携手华为设计，首发三折叠纯平大床引关注

热门内容

本栏最新

东风奕派M8正式开启预售！大六座布局+华为科技加持，19.98万起售

东风奕派M8开启预售：大六座SUV新选择，纯电增程双版本来袭

东风奕派M8正式开启预售！19.98万元起享大六座SUV与华为黑科技

AI浪潮来袭，通信行业如何借力重构模式，开启智能新篇章？

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.