ITBear旗下自媒体矩阵:

英伟达推出Nemotron 3开源模型系列,为AI智能体应用构建高效新选择

   时间:2025-12-16 07:34:20 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

英伟达近日正式推出开源模型系列Nemotron 3,涵盖Nano、Super和Ultra三种规格,旨在为AI智能体应用提供兼具高效性与精准度的解决方案。该系列模型通过引入混合潜在专家(MoE)架构,支持开发者构建大规模、可靠的多智能体系统,应对当前AI开发中通信效率、上下文一致性及推理成本等核心挑战。

据官方介绍,Nemotron 3的MoE架构通过动态激活不同参数子集,显著提升了模型在复杂任务中的表现。例如,在多智能体协作场景中,该架构可减少30%的通信开销,同时将上下文漂移问题降低45%。模型透明度设计允许开发者追踪决策路径,增强对自动化流程的信任度,这一特性在制造业、网络安全等关键领域尤为重要。

目前,安永、思科、Oracle Cloud Infrastructure等十余家企业已将Nemotron 3集成至AI工作流。制造业客户利用其处理供应链优化任务,网络安全团队则通过模型实时分析威胁模式。初创公司反馈显示,该系列模型使原型开发周期缩短60%,企业级部署成本降低50%以上。

具体规格方面,Nemotron 3 Nano作为轻量级模型,参数规模达300亿,每次激活最多30亿参数,专为软件调试、内容摘要等高效任务设计。其100万token的上下文窗口支持长时间多步骤操作,相比前代模型,token处理吞吐量提升4倍,推理成本降低60%。该模型已率先在Hugging Face平台开放下载。

更高规格的Super与Ultra模型分别拥有约1000亿和5000亿参数,支持每token最多激活100亿和500亿参数。Super模型侧重多智能体推理准确性,Ultra则定位复杂AI应用场景,如跨模态内容生成与实时决策系统。这两款模型预计于2026年上半年陆续发布,开发者可提前通过官方渠道申请测试权限。

行业分析指出,Nemotron 3的开源策略将加速AI智能体生态发展。其模块化设计允许企业根据需求灵活组合模型能力,例如在医疗领域结合Nano的快速响应与Ultra的深度分析能力。随着多智能体系统从实验阶段转向规模化应用,该系列模型或成为推动AI产业升级的关键基础设施。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version