滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI生成大提速！UCSD等团队提出JETSPEC方法，破解大模型逐字生成瓶颈

时间：2026-07-01 00:20:28 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

当你在餐厅点完五道菜，却遇到厨师坚持一道一道完成，甚至每道工序都要反复确认时，等待的焦虑感可想而知。这种“逐字生成”的模式，正是当前多数AI大模型处理长文本时的真实写照——无论是撰写数学证明还是生成代码，每个字符的输出都需要重新运行整个模型，效率瓶颈日益凸显。如今，一项由中美多所高校联合研发的JETSPEC技术，通过为AI配备“智能助手”，实现了生成速度的跨越式提升。

传统加速方法中，“推测解码”技术通过助理模型提前预测后续字符，再由主模型批量验证，理论上能显著提升效率。但研究团队发现，现有方案存在根本性矛盾：若助理模型独立预测每个位置，虽速度快却易产生语义矛盾的组合；若采用自回归方式逐步预测，虽逻辑连贯但计算开销随长度增加而激增。这种“快而不准”与“准而不快”的两难困境，成为制约AI生成效率的关键因素。

JETSPEC的创新之处在于构建了“树形候选”机制。助理模型不再生成线性序列，而是同时预测多条分叉路径，每条路径上的字符预测都基于该路径已确定的前序内容。通过“树形因果注意力掩码”技术，模型在处理每个节点时仅参考其所在路径的祖先节点，确保内部逻辑自洽的同时，所有候选路径通过单次前向传播完成预测。这种设计既保留了并行计算的高效性，又避免了语义断裂的问题。

为提升预测准确性，研究团队从主模型中间层提取多层次隐藏状态特征，注入助理模型的计算过程。以Qwen3-8B模型为例，系统从第1、9、17、25、33层提取特征并融合，使助理模型能充分利用主模型的先验知识。训练阶段采用“概率分布匹配”策略，要求助理模型预测的概率分布与主模型尽可能接近，而非简单复制正确答案。实验表明，这种训练方式使候选路径的合理性显著提升，在数学推理任务中，错误路径的概率接近零的案例减少26%。

在候选树构建策略上，JETSPEC采用“最优先扩展”算法，通过优先队列动态管理候选节点。系统根据路径累积概率选择最可能被主模型接受的分叉进行扩展，在有限计算预算内最大化有效候选数量。对比实验显示，纯信息熵评分会导致加速比下降42%，而累积概率评分在各类任务中均表现稳定，证明路径可信度是优化扩展策略的核心指标。

实际测试中，JETSPEC在多个基准测试中展现显著优势。在MATH-500数学推理任务中，当猜测长度为256个词时，加速比达9.64倍，平均每轮接受10.76个词，较传统方法提升300%以上。编程任务Humaneval上，加速比同样突破8倍，且在开放对话场景中保持4.58倍的加速效果。值得注意的是，当集成至工业级推理引擎vLLM后，系统在单GPU上实现6.75倍加速，且能根据并发请求数动态调整计算预算，在轻负载场景下效率提升尤为明显。

研究团队通过对照实验验证了设计选择的必要性。在学习率优化方面，0.0003与0.0006的设定在数学任务中分别实现8.30倍和8.23倍加速；架构对比显示，因果注意力掩码对权重衰减参数完全不敏感，而传统扩散头在参数设置不当时加速比波动超过50%。50道数学题的候选路径分析进一步证明，JETSPEC的虚高评分误差较传统方法降低80%，确保了高速生成与内容质量的平衡。

这项技术的突破性在于证明：在快速草稿生成框架中，保持字符间的因果依赖关系无需牺牲计算效率。通过树形结构设计与主模型特征注入，JETSPEC实现了每词生成开销与分支一致性的双重优化。对于终端用户而言，这意味着AI在处理复杂任务时的响应速度将大幅提升，尤其在需要长文本输出的数学推理、代码生成等领域，效率提升将更为显著。目前，研究团队已公开完整代码与模型，相关论文可通过学术平台查阅。

更多>同类资讯

中昊芯英“须臾®”芯片亮相泰则®2.0智算平台同步升级性能

07-01

强化学习致AI工具调用崩溃？中科院自动化所给出修复新策略

07-01

上海创智学院携手穹彻智能共建联合实验室共育具身智能全栈人才

07-01

复旦大学新突破：机器人学会“自主探索” 适应新环境更高效

07-01

最高近百万的“赛博伴侣”来袭，是科技新宠还是昂贵“玩具”？

07-01

自变量机器人推出X-Tokenizer：重新定义VLA动作离散化新问题

07-01

优必选Cruzr Y1工业人形机器人亮相，旭日芯片助力工业场景能力升级

07-01

OpenAI系统底层优化显成效：AI模型推理成本大幅削减超五成

07-01

AI编程工具“重量级”进化：Codex流量硬盘双飙升，轻与重何去何从？

07-01

邬贺铨院士：2026年工业互联网迈入智能体新阶段，聚焦三大瓶颈与协同发展

06-30

Momenta港股招股引关注，智能驾驶竞争白热化谁能突围？

06-30

邮储银行原行长刘建军谈AI：破除“AI焦虑”需厘清三大认知误区

06-30

GLM-5.3新版本怎么搞？智谱唐杰全球问策，网友齐呼：快补视觉短板！

06-30

深圳众擎机器人科技全资设新公司聚焦智能与工业机器人领域发展

06-30

霞智科技注册资本增至约1.45亿增幅达13%展现发展活力

06-30

点击查看更多 +

全站最新

REDMI K90至尊版来袭！狂暴双芯+超强散热，2999元起开启游戏新体验

雷军谈小米SU7 Ultra纽北表现：立志打造比肩保时捷特斯拉的梦想座驾

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

鸿蒙智行智界V9旗舰MPV受热捧 6月交付量突破5000台大关

14个月10万辆达成，东风日产以体系力破局新能源市场

现代汽车或效仿丰田：主流车型加速混动转型，纯燃油车渐行渐远

热门内容

本栏最新

织密算力网络郑州打造全国算力“数纽”赋能数字中国建设

AI产业下半场：技术创新与产业落地融合下的五大趋势与机遇洞察

15万级荣威家越07将至，AI座舱与智驾升级，能否成家用SUV新宠？

华为极简全闪数据中心2.0：以数智之力，赋能千行百业数智化跃迁

世优科技赋能教育：数字人、动作捕捉与VR课堂共绘智慧校园新图景

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效自然

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.