滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

英伟达TiDAR解码新突破：融合双模型，中小模型AI吞吐量大幅提升

时间：2025-12-03 05:45:58 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

科技领域迎来一项创新突破，英伟达在最新发布的论文中，详细介绍了一种名为TiDAR的新型人工智能解码方法。该方法巧妙融合了自回归与扩散两种模型机制，旨在利用GPU的闲置资源加速文本生成过程。

自回归模型是一种常见的生成方式，其特点在于AI必须依据前一个字符来推测下一个字符，如同玩接龙游戏般按顺序逐个生成内容。而扩散模型则多应用于AI绘画领域，通过逐步消除噪点的方式生成图像或文本。在TiDAR中，扩散机制被赋予新任务——一次性预测多个可能的词汇，为后续筛选提供更多选项。

传统语言模型通常采用逐个生成Token的方式，这种机制虽然稳定，但计算成本高昂且延迟显著。TiDAR的核心创新在于利用模型推理过程中未被充分利用的GPU“空闲槽位”，通过单步生成多个Token的方式，在不降低生成质量的前提下大幅提升响应速度，同时减少GPU运行时间。

从技术原理来看，TiDAR通过训练单个Transformer模型同时执行两项任务：一是标准的自回归“下一词预测”，二是基于扩散的“并行起草”。这种设计打破了以往依赖独立草稿模型的投机解码模式——后者需先用小模型快速生成草稿，再由大模型修正。TiDAR通过结构化的注意力掩码将输入划分为前缀区、验证区和起草区，实现了在同一模型内完成草稿生成与验证的双重功能。

这种架构不仅允许模型利用扩散头并行生成新Token，还能通过自回归头实时验证草稿的准确性。更关键的是，它解决了早期扩散解码器在部署时面临的KV缓存结构失效问题，确保了模型运行的稳定性。

研究团队基于Qwen系列模型展开测试，在Humaneval和GSM8K等基准测试中，TiDAR的准确率与基准模型持平甚至略有提升。速度测试显示，15亿参数版本的TiDAR模型吞吐量增长4.71倍，80亿参数版本的表现更为突出，吞吐量达到Qwen3-8B基准的5.91倍。这表明该技术能有效利用GPU显存带宽，在无需额外显存搬运的情况下生成更多Token。

尽管实验数据表现优异，但TiDAR仍面临规模扩展的挑战。当前测试仅限于80亿参数以下的中小模型，且未采用定制化的内核级优化，仅使用标准PyTorch环境。随着模型参数量和上下文窗口的扩大，计算密度可能趋于饱和，从而削弱“多Token扩展”的成本优势。研究人员计划在更大规模的模型上进一步验证该技术，以评估其作为云端大规模AI部署替代方案的可行性。

更多>同类资讯

第三代特斯拉人形机器人将登场：基于第一性原理设计，可观摩学技能年产能百万

据特斯拉官微2月2日消息，。据介绍，该款机器人将从第一性原理出发，进行重新设计，通过观察人类行为即可学习新技能，预计年产百万台。上证报中国证券网讯据特斯拉官微2月2日消息，。据介绍，该款机器人将从第一性…

02-03

杭州镜识科技发力！首款人形机器人Blot跑出10米每秒新速度

在此前接受橙柿互动记者专访时，当被问及为何聚焦于奔跑速度这一方向，王宏涛表示：“知道物理意义上的极限在哪里，做任何机器人产品就都有了准星。” 在去年8月举行的2025世界人形机器人运动会上，百米“飞人大战”…

02-03

银河通用闻爱荣：跨越“像人”与“能干活”鸿沟，具身智能走向未来

作为成立两年半估值即破200亿的独角兽企业，银河通用走出了一条独特的路径：在数据上，利用合成数据实现“弯道超车”；在商业上，坚持“零售+工业”的双轮驱动——用零售场景的广度验证稳定性，用工业场景的深度打磨精…

02-03

光子计算：或成数据中心升级新引擎，实用化曙光初现

光学技术已经是高性能网络的基础，而新型光子加速器和组件有望为人工智能工作负载带来带宽、延迟和能效的显著提升。最后是计算密度，光子学有可能在更小的芯片中集成更多计算能力，从而实现更小的计算设备和更高效的数据中心…

02-03

2026科技新图景：十大趋势引领人机协作新纪元，生活工作全面升级

这些AI系统还将与智能设备深度结合，形成完整的数字生态，为用户打造更具适应性与主动性的生活体验。随着轻量化MR（混合现实）设备的普及，工作方式将在2026年迎来根本性改变。可交互的虚拟对象与仪表盘共…

02-03

光子计算：以光为翼，数据中心未来变革的潜力新方向

光学技术已经是高性能网络的基础，而新型光子加速器和组件有望为人工智能工作负载带来带宽、延迟和能效的显著提升。最后是计算密度，光子学有可能在更小的芯片中集成更多计算能力，从而实现更小的计算设备和更高效的数据中心…

02-03

全尺寸人形机器人Bolt问世：峰值速度10m/s 逼近人类百米世界纪录

02-03

阶跃星辰开源Step 3.5 Flash

02-03

全球首个峰值速度达10m/s的全尺寸人形机器人Bolt发布

02-03

Uber加码自动驾驶投资，Waabi获十亿融资剑指25000辆机器人出租车

02-03

阿童木机器人冲刺IPO：份额与毛利背后，靠什么筑牢增长护城河？

02-03

浙江荣泰递表港交所谋A+H上市 2025年前三季度净利润达2.05亿

02-03

灵猴机器人获超亿元Pre-B轮融资，蔚来资本领投，具身智能业务前景可期

02-03

阶跃星辰Step 3.5 Flash发布，多家芯片厂商适配，共推大模型应用落地

02-03

阶跃星辰发布Step 3.5 Flash模型壁仞、燧原科技率先完成适配并兼容

02-03

点击查看更多 +

全站最新

小米汽车1月交付量引热议雷军回应：淡季加车型调整成绩已很了不起

雷军揭秘新一代SU7：研发收官量产在即，2月13日展车进店可体验

雷军直播穿劳保鞋引关注！展示姿势被赞曼妙网友笑称可转行带货

科大讯飞研究院实习生招募进行时，加入我们共探科技新未来！

青岛城阳区“萝卜快跑”试运营，山东无人驾驶网约车再添新力量

黑芝麻智能“芯片+生态”双布局：破局高阶智驾，协同难题待解

热门内容

本栏最新

浙江荣泰递表港交所谋A+H上市 2025年前三季度净利润达2.05亿

智己LS9 Hyper登场：三电机四驱加持，探照灯地暖打造豪华新体验

华为开源生态新飞跃：鲲鹏引领超节点，昇腾CANN赋能AI新生态

Kimi海外收入反超国内新模型K2.5助力其向“Anthropic+Manus”目标迈进

苏州安川机器人配件选购更换全攻略：正品渠道与调试要点一文详解

理想汽车2026年1月交付27668辆累计交付破156万超充网络持续扩张

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.