ITBear旗下自媒体矩阵:

Nvidia发布Nemotron-Nano-9B-v2小型模型:创新推理切换,高效部署新选择

   时间:2025-09-01 19:50:25 来源:ITBEAR编辑:快讯团队 IP:北京 发表评论无障碍通道
 

近日,科技巨头Nvidia震撼发布了其最新研发的小型语言模型——Nemotron-Nano-9B-v2,此举再次点燃了业界对小型模型技术的热情。

这款新型模型配备了9亿个参数,尽管相较于某些仅拥有数百万参数的小型模型,其规模略显庞大,但与最初设计的12亿参数相比,已实现了显著的参数精简。Nvidia AI模型后训练部门主管Oleksii Kuchiaev在社交媒体透露,此次参数调整旨在优化模型部署的灵活性,并确保其能在Nvidia A10GPU上流畅运行。尤为该模型采用了创新的混合架构,使得在处理大规模数据时,其速度比同级别变换模型快出6倍。

Nemotron-Nano-9B-v2在语言支持上展现出广泛兼容性,不仅精通英语,还涵盖了德语、西班牙语、法语、意大利语及日语等多种语言。其应用场景广泛,无论是指令遵循还是代码生成,都能游刃有余。更令人瞩目的是,该模型内置了一项革命性功能:用户只需通过简单的控制令牌,就能轻松切换AI的“思考”模式,即在输出答案前进行自我验证。系统默认会记录思考轨迹,但用户也可通过如/think或/no_think等指令灵活控制这一过程。该模型还引入了“思考预算”管理机制,允许开发者根据需要设定推理过程中的标记数量,从而在确保准确性的同时,也兼顾了响应速度。

在一系列基准测试中,Nemotron-Nano-9B-v2的表现尤为抢眼。特别是在启用“思考”模式后,它在AIME25、MATH500、GPQA及LiveCodeBench等测试中均取得了优异成绩。同时,在指令遵循和长上下文基准测试中,该模型也展现出了超越其他同类开放小型模型的精确度。

为了推动技术的普及与应用,Nvidia为Nemotron-Nano-9B-v2制定了开放的许可协议,赋予了开发者在商业领域自由使用与分发的权利,并明确表示不会对所生成的输出主张所有权。这一举措意味着,企业无需繁琐的谈判流程,即可直接将模型投入生产使用,大大降低了使用门槛和成本。

Nvidia推出的Nemotron-Nano-9B-v2模型,无疑为追求小规模推理能力和高效部署的开发者提供了强有力的支持。其独特的运行预算控制和推理模式切换功能,为系统开发者带来了前所未有的灵活性,旨在提升模型的准确性和响应速度,进一步加速了小型语言模型技术的发展步伐。

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version