ITBear旗下自媒体矩阵:

英伟达CES 2026发布两款桌面AI超算,DGX Station可本地运行万亿参数模型

   时间:2026-01-06 14:26:03 来源:ITBEAR编辑:快讯 IP:北京 发表评论无障碍通道
 

在近期举办的CES 2026展会上,英伟达正式推出两款桌面级AI超级计算机——DGX Spark与DGX Station,标志着本地AI开发正式迈入"超算时代"。这两款设备基于全新NVIDIA Grace Blackwell架构打造,通过集成大容量统一内存与Petaflop级算力,为开发者提供了无需依赖云端集群的本地化解决方案。

针对不同规模的开发需求,两款设备形成差异化定位。定位入门级的DGX Spark专为千亿参数模型优化,其创新的NVFP4数据压缩技术可在保持模型智能表现的前提下,将存储需求降低70%。在视频生成场景测试中,该设备运行Black Forest Labs的FLUX.2模型时,较搭载M4 Max芯片的顶级MacBook Pro快8倍。通过与llama.cpp等开源社区的深度协作,DGX Spark在运行SOTA模型时平均性能提升35%,大语言模型加载速度显著加快。

面向企业级应用的DGX Station则展现出更强大的计算能力。配备GB300 Grace Blackwell Ultra超级芯片与775GB FP4精度一致性内存,该设备可本地运行万亿参数规模的巨型模型。其采用的NVLink-C2C或PCIe Gen6/7互连技术,通过硬件级数据同步架构实现CPU与GPU间的零拷贝数据传输,将延迟控制在极低水平。FP4精度格式通过1位符号、2位指数、1位尾数的E2M1布局设计,在维持模型精度的同时,将显存占用压缩至FP16格式的四分之一,吞吐量提升2-3倍。

英伟达公布的模型支持清单显示,DGX Station可兼容Kimi-K2 Thinking、DeepSeek-V3.2、Mistral Large 3等前沿架构。vLLM核心维护者Kaichao You指出,该设备使研发团队能够以极低成本测试GB300专属特性,显著提升开发效率。在软件生态建设方面,DGX Spark已集成NVIDIA AI Enterprise软件栈,并针对机器人控制、基因组分析、金融建模等领域推出专项开发手册。

硬件供应方面,DGX Spark将通过戴尔、惠普、联想、华硕等合作伙伴的GB10系统即刻发售,而旗舰级DGX Station计划于年内晚些时候正式上市。这两款设备的推出,不仅重新定义了桌面级AI计算的性能边界,更为从原型开发到规模化部署的全流程提供了无缝衔接的解决方案。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version