ITBear旗下自媒体矩阵:

英伟达推出60B双塔架构AI模型开源,并行生成文本效率高,速度质量双提升

   时间:2026-07-03 20:59:36 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

英伟达近日发布了一款名为Nemotron-Labs-TwoTower的离散扩散语言模型,针对大模型逐Token生成效率低的问题提出了创新解决方案。该模型通过双塔架构设计实现了文本生成速度的显著提升,相关技术权重已在Huggingface平台全面开源,为开发者提供了新的技术选择。

这款模型采用独特的600亿参数双塔架构,将整体参数拆分为两个300亿规模的独立神经网络。实际运行中每座神经网络仅激活30亿参数,同时集成128个可路由专家模块。其中上下文塔保持静态冻结状态,专注维护全文语义连贯性;去噪塔则通过扩散机制实现并行文本生成,两塔通过交叉注意力机制实现数据交互。这种设计使模型在保持98.7%原版综合能力的同时,将文本生成吞吐量提升至2.42倍,仅在代码生成和数学推理等特定任务中出现轻微性能波动。

技术实现层面,该模型基于现有Nemotron骨干网络改造,通过复用预训练权重避免了从零训练的高昂成本。在硬件配置上,完整推理需要双张H100或A100 80GB显卡协同工作,单卡模式下仅支持传统的自回归生成方式。经过多维度基准测试验证,模型在常识推理、阅读理解等任务中的表现与原版基本持平,成功在生成速度与内容质量之间取得平衡。

开发部署方面,英伟达采用专属开源协议开放模型权重,允许开发者自由进行下载测试和商业应用。该模型已通过涵盖数学、代码、常识等领域的全面测试,证明其能够适应多种推理场景需求。这种开放策略不仅降低了技术门槛,也为AI社区提供了新的模型架构参考,特别适合需要处理大规模文本生成的商业应用场景。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version