在英伟达GTC 2026大会上,开源模型成为核心议题之一。公司不仅在主题演讲中重点展示了六个模型家族的最新进展,还宣布成立Nemotron联盟,并由CEO黄仁勋主持了Open Model圆桌讨论。这一系列动作表明,开源模型已上升为英伟达战略优先级最高的方向之一。作为以芯片和加速计算闻名的企业,英伟达在模型领域的深度布局引发行业关注。
英伟达AI软件副总裁Kari Briski将模型比作“库”,这一类比背后是公司对CUDA生态成功经验的迁移。自2007年发布以来,CUDA通过提供预编译的工具包,使开发者无需从零开始编写GPU程序。全球主流AI框架均基于CUDA优化,使得绝大多数AI训练和推理任务运行在英伟达技术栈上。这种“长期维护、硬件同步更新、保证兼容性”的模式,正是Briski希望通过开源模型复制的生态优势。
在极致协同设计理念下,英伟达训练模型具有双重目标:对外提供可微调的公共资源,对内则作为基础设施的压力测试工具。以Blackwell架构推出的NVFP4 4位浮点格式为例,该技术通过双层缩放机制将模型内存占用缩减至FP16的1/3.5,同时保持关键任务精度损失低于1%。这种突破源于从芯片张量核心到训练框架的全链路优化,验证了软硬件协同设计的价值。
大会发布的六个模型家族覆盖了AI应用的前沿领域:Nemotron专注语言理解,Cosmos构建物理世界模型,Isaac GR00T赋能人形机器人,Alpamayo服务自动驾驶,BioNeMo支持生命科学,Earth-2专注气候模拟。这些模型不仅共享数据资源,更形成清晰的技术路线图。以Nemotron为例,其Nano、Super、Ultra三个规格模型已规划至2027年,Ultra版本已完成5000亿参数基础训练。
Nemotron联盟的成立标志着英伟达生态战略的升级。该联盟汇聚了Mistral AI、Perplexity、LangChain等机构,成员将基于DGX Cloud算力参与模型训练、数据贡献和评估框架开发。这种开放模式超越传统权重开放,英伟达同步公开了后训练方案、强化学习环境和验证器。其预训练数据集规模达10万亿token,相当于为行业提供了一套完整的“模型开发工具链”。
企业级应用场景正在重塑模型训练范式。SAP需要在ERP系统中训练模型调用2000个工具接口,Edison Scientific则开发了科学工具专用agent。这些需求推动英伟达开放训练环境资源,帮助企业减少重复开发。据测算,完整工具链的开放可使企业节省30%以上的算力投入,将资源集中于垂直领域优化。
Agent经济的崛起带来新的技术挑战。当前AI算力需求已从预训练延伸至agent协作阶段,单个任务可能涉及数十万token交互。针对这一趋势,英伟达推出企业级方案NemoClaw,其核心组件OpenShell通过隐私路由器机制,在数据外传前自动剥离个人身份信息。该方案支持本地推理与云端协同,安装配置仅需一条命令。
尽管安全机制不断完善,企业级agent部署仍面临信任门槛。Briski指出,企业需明确三个关键问题:agent的权限范围、代理身份和认证凭证。这些问题本质是技术解决方案与组织流程的适配难题。在OpenClaw创始人Peter Steinberger看来,这需要建立类似云计算时代的新的安全标准体系。
当被问及生成式AI的发展阶段时,Briski用"垂直增长曲线"形容其扩张速度。这种判断基于英伟达观察到的算力需求演变:从预训练到后训练,再到推理时扩展,最终迈向agent协作时代。每个阶段的算力消耗均呈现指数级增长,而模型开放策略正在成为释放这种潜力的关键杠杆。











