英伟达公司正式推出其迄今为止性能最强的开源权重AI模型——Nemotron 3 Super。这款专为复杂智能体系统设计的模型拥有1200亿参数,采用混合专家架构,在推理时仅激活120亿参数,既保证了计算效率又降低了资源消耗。与完全闭源的GPT-4等模型不同,该模型将核心参数完全开放,允许开发者自由下载、运行及微调。
行业应用方面,Perplexity、Palantir和西门子等科技巨头已率先将其引入核心业务场景。在搜索优化、软件开发、电信网络设计及半导体制造等领域,该模型展现出强大的任务处理能力,尤其擅长支撑自主智能体完成高精度复杂任务。其百万Token的超大上下文窗口设计,有效解决了多智能体交互中常见的"上下文爆炸"问题,使工作流状态保持完整,显著降低多步推理成本。
技术架构实现多重突破。混合专家架构使模型吞吐量提升5倍,准确率较前代产品翻倍。创新性的Mamba层结构将内存与计算效率提高4倍,配合Transformer层的高级推理能力,形成高效协同。通过"潜在MoE"技术,模型能以单个专家的计算成本激活四个专家,配合多token预测功能使推理速度提升3倍。在英伟达Blackwell平台上采用NVFP4精度运行时,内存需求较Hopper架构的FP8降低75%,推理速度提升4倍。
开源策略体现高度开放性。除公开模型权重外,英伟达同步发布了完整的训练方法,包括超10万亿token的数据集构成和评估方案。该模型支持直接加载完整代码库进行端到端调试,也能瞬间处理数千页规模的财务报告等长文本。开发者可通过Hugging Face平台或谷歌云、甲骨文等云服务商获取模型,AWS和Azure版本即将上线。
部署方案兼顾灵活性与便捷性。模型已封装为NVIDIA NIM微服务,支持在本地数据中心和云端环境无缝部署。这种设计既满足企业级应用对数据安全的要求,又为中小开发者提供了低成本接入途径。混合专家架构的动态参数激活机制,使企业可根据实际需求灵活调整计算资源投入。











