滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

南洋理工等高校研究新突破：AI语言模型多字预测提速，推理更高效

时间：2026-04-16 21:57:18 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

语言模型生成文字时逐字输出的方式，正在被一项名为MARS的新技术打破。这项由三所高校联合开发的技术，通过让模型在特定场景下同时预测多个字符，显著提升了推理效率。研究团队在预印本平台发布的论文显示，该方法在保持生成质量的同时，将模型输出速度提升至原来的1.5倍以上。

传统语言模型采用自回归架构，每个字符的生成都需要完整的前向计算过程。这种设计导致模型在处理确定性内容时，如"综上所述"等固定表述，仍需消耗同等计算资源。研究人员形象地比喻，这相当于厨师处理简单葱段与复杂法餐时，都要重新布置整套厨具。MARS技术通过引入掩码预测机制，使模型能够识别确定性场景，实现多字符并行预测。

在技术实现层面，研究团队设计了独特的双轨训练框架。模型同时处理原始文本和经过掩码处理的版本，前者用于维持标准语言模型能力，后者训练多字符预测能力。通过特殊设计的注意力机制，确保预测过程中始终遵循因果关系，即每个字符只能参考其左侧已生成内容。实验数据显示，当掩码块大小设置为4个字符时，模型在数学推理任务上的得分提升4.5分，代码生成能力提升3分。

该技术的核心突破在于解决了多字符预测中的四大技术难题。除必要的掩码占位外，研究团队通过保持单向注意力机制、固定预测位置偏移量、维持严格从左到右生成顺序，成功消除了传统方法中存在的三大偏差。这种设计使模型在扩大预测块大小时，仍能保持稳定的训练信号强度。当块大小从4增加到16时，加入完整版损失训练的模型得分波动控制在0.7分以内，而传统方法得分下降达6.2分。

在实际应用中，MARS采用滑动窗口机制实现动态加速。模型根据置信度阈值τ决定每次接受的字符数量，当预测字符概率超过阈值时，系统自动将其纳入输出序列。这种设计使服务提供商可根据负载情况动态调整参数：高负载时降低阈值提升吞吐量，需要高质量输出时提高阈值确保准确性。测试表明，在批量处理场景下，优化后的缓存策略可使模型吞吐量提升1.7倍。

与需要维护双模型的推测解码方案相比，MARS展现出显著优势。该技术无需额外模型或参数，仅通过继续训练即可实现功能升级。在5亿参数和70亿参数两个规模的模型测试中，MARS训练后的模型在标准输出模式下，指令遵循得分分别提升1.7分和1.5分，证明掩码训练本身具有数据增强效果。研究团队特别指出，当阈值设置为0.95时，70亿参数模型在保持0.2分精度优势的情况下，平均每次输出1.68个字符。

这项研究同时揭示了现有技术的局限性。双轨训练使计算量增加约一倍，小模型训练时间从15GPU小时延长至33GPU小时。在输出长度敏感的数学和代码任务中，传统未训练模型反而因天然知晓输出长度而表现略优。研究团队正在探索动态块大小调整和异步缓存策略，以进一步提升技术实用性。完整技术细节和实验数据已通过论文编号arXiv:2604.07023公开，相关代码在GitHub平台开放下载。

更多>同类资讯

AI突破酶设计瓶颈：无需天然模板，直接“定制”全新化学反应催化剂

04-16

Vertical Aerospace完成全球首例DOA监管下双向载人过渡飞行，eVTOL板块迎来新突破

04-16

利亚德2025年财报亮眼：扭亏为盈技术创新与市场拓展双轮驱动发展

04-16

轻舟试验飞船首战告捷：关键技术突破，低成本探索与拓展任务圆满收官

4月2日、3日，轻舟试验飞船先后成功释放两颗搭载小卫星，并与新征程01星开展了远距离抵近与安全撤离试验，验证了多体变构姿轨耦合控制技术的实用性。其通用化搭载平台实现载荷“即插即用”，目前已完成6项新技术载荷试…

04-16

轻舟货运飞船试飞成功白象携手航天共启深空探索新征程

作为航天运输体系的新生力量，轻舟货运飞船秉承“低成本、高可靠、高应变、高智能”的理念，在研发与实践中攻克多项技术难关，聚力为航天任务提供高效物资补给保障。据悉，轻舟货运飞船计划明年与空间站对接，轻舟货运飞…

04-16

紫微科技商业空间站新进展：迪迩十一号通过评审 2026年计划发射

IT之家从紫微科技官方公告获悉，迪迩十一号是紫微科技自主研制的首个商业空间站 V1.0 版的重要组成部分。迪迩一号光学遥感卫星由北京紫微宇通科技有限公司和北京航天驭星科技有限公司联合研制，入轨后开展卫星平…

04-16

毫米线虫启程赴国际空间站助力探索微重力环境奥秘

它在太空中提供了一个独特的微重力环境，这为科学研究提供了绝佳的条件。通过在国际空间站上的长期驻留和实验，我们可以更好地了解人类在太空中的生存需求和挑战，为未来的火星任务等深空探索奠定基础。尽管国际空间站已经…

04-16

“邮储银行号”遥感卫星升空助力金融服务智能化与实体经济高质量发展

目前，卫星数据已接入邮储银行“绿洲”主动风险防控平台。下一步，邮储银行将持续深化与科技企业合作，拓展前沿技术在金融业务中的应用，持续完善覆盖全面、贯穿全程、实时响应、全域联动的风险管理体系，助力实体经济高…

04-16

轻舟试验飞船成果丰硕：技术突破、降本增效、拓展任务样样行

本次试飞围绕关键技术验证、低成本设计与探索和拓展任务三个方面展开，圆满完成既定目标，为后续轻舟货运飞船正样研制奠定坚实基础。4月2日、3日，轻舟试验飞船先后成功释放两颗搭载小卫星，并与新征程01星开展了远距离…

04-16

鸡西科技馆周末课：动手实践解锁科学，科创小课堂趣学无限

四大科创手工课同步上线，孩子们在拼装、调试、创作中，把太阳能、机械传动、电路动力、滑轮力学装进小课堂，在动手实践中解锁看得见的科学原理，收获满满快乐与知识～课程融合仿生科学+机械联动，孩子们在组装中认识杠杆与…

04-16

《王者荣耀》携手上海天文馆，VR互动剧《星海奇航》邀你暑期共赴星空救援

04-16

AMD 2027年EPYC Verano处理器将支持LPDDR5X SOCAMM2 助力AI服务器能效提升

04-16

瑞典央行副行长：目前中东局势溢出效应的风险低于2022年通胀开始上升时的水平

04-16

摩通下调超微电脑目标价至28美元

04-16

富国银行上调ASML目标价至1750美元

04-16

点击查看更多 +

全站最新

华为云OfficeClaw办公智能体邀测开启，为企业办公效率提升注入新动力

大疆Osmo Pocket 4携双摄版登场，第四代产品分层布局满足多元创作需求

大湾区科技突破：全固态电池A样问世，2026年或实现GWh级量产

零跑D19豪华旗舰SUV正式登场！21.98万元起售，配置丰富动力强劲

速腾聚创发布"孔雀羽"预告，神秘芯片或有重大突破

3年11月！"AI+光储一体化第一股"思格新能源刷新中国企业港股IPO最快纪录，获淡马锡、高瓴等"全明星"资本加持

热门内容

本栏最新

速腾聚创发布"孔雀羽"预告，神秘芯片或有重大突破

3年11月！"AI+光储一体化第一股"思格新能源刷新中国企业港股IPO最快纪录，获淡马锡、高瓴等"全明星"资本加持

易鑫亮相"2026世界互联网大会亚太峰会"，宣布年内开源AI Infra

龙虎榜 | 两路游资联手围猎长信科技！涪陵广场路3.55亿揽筹大普微

ETF风向标 | 创业板指创近11年新高，AI硬件全线爆发，创业板人工智能ETF涨超5%，港股通创新药ETF汇添富单日“吸金”超11亿

台积电赚麻了！Q1净利暴增58%，中东局势难挡AI热潮

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.