英伟达近日正式推出开源模型系列Nemotron 3,涵盖Nano、Super和Ultra三种规格,旨在为AI智能体应用提供兼具高效性与精准度的解决方案。该系列模型通过引入混合潜在专家(MoE)架构,支持开发者构建大规模、可靠的多智能体系统,应对当前AI开发中通信效率、上下文一致性及推理成本等核心挑战。
据官方介绍,Nemotron 3的MoE架构通过动态激活不同参数子集,显著提升了模型在复杂任务中的表现。例如,在多智能体协作场景中,该架构可减少30%的通信开销,同时将上下文漂移问题降低45%。模型透明度设计允许开发者追踪决策路径,增强对自动化流程的信任度,这一特性在制造业、网络安全等关键领域尤为重要。
目前,安永、思科、Oracle Cloud Infrastructure等十余家企业已将Nemotron 3集成至AI工作流。制造业客户利用其处理供应链优化任务,网络安全团队则通过模型实时分析威胁模式。初创公司反馈显示,该系列模型使原型开发周期缩短60%,企业级部署成本降低50%以上。
具体规格方面,Nemotron 3 Nano作为轻量级模型,参数规模达300亿,每次激活最多30亿参数,专为软件调试、内容摘要等高效任务设计。其100万token的上下文窗口支持长时间多步骤操作,相比前代模型,token处理吞吐量提升4倍,推理成本降低60%。该模型已率先在Hugging Face平台开放下载。
更高规格的Super与Ultra模型分别拥有约1000亿和5000亿参数,支持每token最多激活100亿和500亿参数。Super模型侧重多智能体推理准确性,Ultra则定位复杂AI应用场景,如跨模态内容生成与实时决策系统。这两款模型预计于2026年上半年陆续发布,开发者可提前通过官方渠道申请测试权限。
行业分析指出,Nemotron 3的开源策略将加速AI智能体生态发展。其模块化设计允许企业根据需求灵活组合模型能力,例如在医疗领域结合Nano的快速响应与Ultra的深度分析能力。随着多智能体系统从实验阶段转向规模化应用,该系列模型或成为推动AI产业升级的关键基础设施。











