英伟达在人工智能领域再推重磅举措,正式发布全新开源模型Nemotron 3 Nano Omni,将业务版图从传统的算力供应向模型平台领域大幅拓展。这款模型以“原生全模态理解+高效推理”为核心卖点,旨在为企业级AI智能体构建一体化基础模型底座,助力AI技术在企业场景中实现更广泛的应用。
在多模态处理能力上,Nemotron 3 Nano Omni展现出独特优势。与传统多模态模型通过拼接多个子模型实现能力融合不同,它强调“原生全模态”特性,能够同时处理文本、图像、音频甚至视频输入,并在统一架构内完成理解与推理任务。英伟达在技术博客中介绍,该模型具备从视频和文档中提取信息的能力,支持复杂场景下的跨模态推理,例如通过语音转录增强视频理解,或结合OCR技术解析视觉文本内容。
从模型架构来看,Nemotron 3 Nano Omni延续了Nemotron 3系列的混合架构路线。它融合了Transformer与Mamba机制,并引入混合专家(MoE)技术,在保持性能的同时大幅降低推理成本。该模型采用约300亿参数规模,但通过MoE机制每次仅激活30亿参数,在性能与成本之间找到了良好的平衡点。同时,它支持超长上下文处理,最高可达百万token级别,非常适合处理复杂文档与长流程任务。
此次发布的Nemotron 3 Nano Omni将重点瞄准AI智能体领域。英伟达明确将其定位为代理式AI的基础模型,不仅用于生成内容,更致力于驱动具备决策与执行能力的智能体系统。官方资料显示,Nano Omni是首个“生产级开放模型”,专为构建可扩展AI Agent设计,支持长上下文、多步骤推理以及工具调用等能力。该模型还引入GUI训练数据,使AI能够理解和操作界面元素,进一步贴近真实应用场景,例如自动化办公流程、软件操作以及复杂工作流执行等。
在市场应用方面,Nemotron 3 Nano Omni已获得一批AI与软件领域公司的青睐。Aible、Applied Scientific Intelligence (ASI)、Eka Care、富士康、H Company、Palantir和Pyler等公司已率先采用该模型。同时,戴尔、DocuSign、Infosys、K-Dense、Lila、甲骨文和Zefr等公司正在对其进行评估,未来有望进一步扩大其应用范围。
英伟达在模型发布中再次强调“开放”策略。Nemotron 3 Nano Omni不仅开放模型权重,还配套提供训练数据、工具链(如NeMo)以及优化方案,试图打造完整的开发生态。这一策略在当前AI行业分化加剧的背景下具有重要意义。一方面,部分头部厂商逐步转向闭源;另一方面,中国及开源社区持续推进开放模型。英伟达试图以“开放+高性能”的组合切入中间地带,吸引更多开发者与企业客户。
随着AI应用从简单的“聊天机器人”向“智能代理”迈进,模型能力的竞争也发生了升级。从单一的语言理解能力,转变为多模态融合与任务执行能力的系统竞争。Nemotron 3 Nano Omni的推出,显示出英伟达不仅要继续提供算力支持(GPU),还要提供完整的“施工方案”(模型与工具链),进一步深化其在AI产业链中的布局。








