ITBear旗下自媒体矩阵:

英伟达开源新模型:双塔架构破解吞吐瓶颈,生成效率提升超两倍

   时间:2026-07-02 00:55:12 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

英伟达近日在人工智能领域迈出重要一步,正式开源其最新研发的Nemotron-Labs-TwoTower扩散语言模型。这款模型通过突破性的架构设计,为大规模文本生成任务提供了更高效的解决方案,有望打破传统模型在处理速度上的技术瓶颈。

传统自回归模型在生成文本时采用逐个token串行处理的方式,这种机制在面对海量数据合成需求时效率明显受限。英伟达研发团队提出的"双塔"架构创新性地将任务分解为两个独立模块:固定参数的"上下文塔"专门负责解析输入提示并维持语言理解能力,而经过针对性训练的"去噪器塔"则承担并行生成与优化token的重任。这种分工模式使模型在保持核心功能的同时,实现了处理效率的质的飞跃。

性能测试数据显示,在配备双H100GPU的实验环境中,新模型在维持基线模型98.7%生成质量的前提下,将实际吞吐量提升至2.42倍。这种质量与速度的平衡优化,特别适用于需要批量生成合成文本的数据处理场景,为相关领域提供了兼具性能与效率的技术工具。

该模型的设计充分考虑到开发者的实际需求,支持扩散模式、模拟自回归和标准自回归三种解码方式。这种灵活性使研究人员可以根据具体任务特点,在生成质量、速度和资源消耗之间自由调配。作为开放权重项目,模型遵循NVIDIA Nemotron开放协议,允许商业用途的二次开发与应用。

尽管测试表明模型在代码生成和数学推理任务中的表现较基线模型略有下降,且对GPU显存容量有特定要求,但其架构优化思路为行业提供了重要参考。随着人工智能应用场景向高频次、大规模方向扩展,通过算法架构创新提升推理效率的技术路径,正在成为模型研发领域的新焦点。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version