ITBear旗下自媒体矩阵:

英伟达个人超算DGX Spark系统更新,大模型推理提速 2.5 倍

   时间:2026-01-06 22:20:58 来源:鞭牛士编辑:快讯 IP:北京 发表评论无障碍通道
 

AIPress.com.cn报道

1月6日消息,英伟达称,其个人 AI 超算DGX Spark凭借最新的系统更新,在生成式 AI 和复杂工作负载处理上实现了飞跃式进步。通过引入全新的NVFP4(4 位浮点数)数据格式支持,两台通过 ConnectX-7 互联的 DGX Spark 系统在运行拥有 2350 亿参数的Qwen 235B模型时,推理速度提升了2.5 倍。

得益于 CUDA 核心的持续优化,Omniverse Isaac Sim 的性能翻倍,而 Qwen3 30B、Stable Diffusion 3.5 等主流模型也获得了超过 30% 的效率提升。

在英伟达展示的一个典型案例中,DGX Spark 与MacBook Pro协同工作,通过 NVFP4/NVFP8 精度与 RTX 视频超分辨率(VSR)技术,将 4K AI 视频的生成时间从笔记本单独运行的 8 分钟缩短至仅 1 分钟,效率提升高达 8 倍。而在 3D 创作流(如 RTX Remix)中,用户可以将繁重的材质生成(Texture Generation)任务卸载至拥有 128GB 统一内存的 DGX Spark 上处理,从而释放主机的 RTX 5090 显卡去应付更高强度的渲染任务。

为了进一步降低 AI 开发门槛,英伟达扩展了其DGX Spark Playbooks教程库,新增了包括 vLLM 推理、本地运行 Nemotron-3-Nano、单细胞 RNA 测序、以及基于 Isaac Sim 的机器人工作流等七项全新指南。

值得注意的是,原本仅能在云端运行的高级开发工具Nsight Copilot AI,现在凭借 DGX Spark 强大的 Blackwell 架构和 128GB 显存,已能实现完全本地化的离线运行。这标志着开发者从此拥有了一个无需联网、隐私安全且具备“P级”算力的个人 AI 实验室。

目前,DGX Spark 已正式加入 NVIDIA 认证系统计划,这意味着它在稳定性与兼容性上达到了企业级标准。对于那些需要在本地微调 70B 级别模型或进行复杂物理 AI 仿真的用户来说,DGX Spark 正在重新定义桌面计算的极限。(AI普瑞斯编译)

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version