滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek又变强了：发布DSpark框架推理速度提升超60%

时间：2026-06-28 09:56:29 来源：TechWeb编辑：快讯 IP：北京 发表评论无障碍通道

6月27日，DeepSeek团队联合北京大学发布名为《DSpark》的研究论文（基于speculative decoding方向），提出一种用于加速大模型推理的新方法。

该技术在保持生成文本分布完全无损（Lossless）的前提下，成功突破了大语言模型（LLM）在高并发生产环境中的推理性能瓶颈，实测数据显示，其单用户生成速度较现有主流方案最高提升85%。

目前，该框架已被部署在DeepSeek-V4-Flash 与 DeepSeek-V4-Pro的真实线上流量中，大幅加速了大语言模型（LLM）的推理速度。

值得注意的是，DeepSeek创始人梁文锋也位列论文作者名单之中。

大模型推理的“速度焦虑”

据了解，主流语言模型生成文本时，基本采用 autoregressive（自回归）方式。每生成一个新token都需要一次完整的前向传播，推理延迟随输出长度线性增长。这也造成了大模型回复总感觉很慢的原因。

在实时对话、多轮智能体工作流等高交互场景中，生成速度直接影响用户体验，也会影响GPU利用率。

推测解码技术提供了一条解决路径：用一个轻量级草稿模型快速生成若干候选token，再由大模型批量验证。

然而，现有方案各有缺陷。自回归草稿模型逐token串行生成，质量虽高但生成延迟随候选长度线性增长；并行草稿模型虽能一次产出全部候选，但token间缺少依赖关系，导致后续候选被大量拒绝，浪费计算资源。

DSpark的两把“手术刀”

围绕上述两大瓶颈，DSpark提出了两项互补机制。

一个是“半自回归生成”架构（Semi-Autoregressive Generation）。

DSpark在并行生成主干的基础上引入轻量级顺序模块，逐token注入前缀依赖信息。可以理解为：前面用并行方式快速铺开候选，后面再用一个很轻的顺序模块检查相邻 token 的衔接关系。

该模块提供两种实现——仅依赖前一个token的马尔可夫头，以及通过循环状态累积完整前缀信息的RNN头。实验表明，两层Transformer深度的DSpark即可在所有测试领域上超过五层DFlash的接受长度。

另一个是置信度调度验证机制。

传统方案对整段候选无差别校验，在高负载时大量算力被浪费在极可能被拒绝的尾部token上。

置信度调度验证机制，可根据不同请求的成功概率与系统负载，自适应调整验证长度，从而减少无效计算开销。

在离线测试中，该方法显著提升了可接受生成长度；在DeepSeek-V4线上系统中，相比基线模型，推理速度提升约60%–85%，并有效降低高并发下的吞吐损耗。

DSpark在每个候选位置输出置信度分数，预测该token的存活概率。硬件感知前缀调度器根据实时引擎吞吐量，为每个请求动态决定最优验证长度，优先将算力分配给预期回报最高的token。

据了解，论文还同时开源了模型检查点与训练框架DeepSpec，以推动社区进一步研究。DeepSpec是一个面向speculative decoding训练的代码库，包含Eagle3、DFlash 和 DSpark。

更多>同类资讯

人口与AI浪潮下，不必焦虑内卷，养好身体等时代机遇到来

06-28

豆包开启收费模式，AI大模型商业化下半场如何破局？

06-28

DeepSeek开源DSpark框架：破解AI“挤牙膏”难题，推理加速再升级

06-28

机器人产业热潮涌动：百万年薪揽才背后，泡沫与机遇并存

06-28

Anthropic调研：Claude用户眼中AI成工作好帮手协同发展成期待

06-28

选购二手KUKA焊接机器人必看：精准匹配工况，确保状态真实，强化后期保障

许多采购者往往只关注价格和品牌，却忽略了设备与自身实际焊接工艺（如不锈钢的特定要求）及生产节拍的契合度。作为在工业机器人集成领域深耕多年的服务商，天津理想动力科技有限公司基于大量的项目实践观察到，成功的二手设…

06-28

依必安派特战略转型显成效：剥离低利润业务，营收增长目标直指30亿欧元

06-28

Anthropic调研：Claude用户眼中AI成工作好帮手协同发展成期待

06-28

仓库自动搬货箱机器人主流技术路线解析：参盘、Figure AI、Apptronik方案对比

汽车制造产线物料搬运零部件配送与产线其他设备协同作业路线特点总结：从汽车制造这一高要求场景切入，通过与头部车企合作验证技术。对于关注“仓库里自动搬货箱的机器人”技术选型的用户来说，参盘科技的WAM路线提供…

06-28

16亿收购烟台LNG企业，1000万潍坊设厂，重庆机器人“小巨人”山东布局显锋芒

2025年12月，七腾机器人及其一致行动人抛出方案，计划合计出资约16.86亿元，通过“协议转让+部分要约收购”的组合拳拿下控制权。收购一家亏损的LNG公司，又火速在潍坊落子，七腾机器人要的显然不是LNG业…

06-28

华为汪涛：2026成移动通信拐点，2027年将制定未来二十年新标准

6月24日，在2026世界移动通信大会上海期间，华为副董事长、轮值董事长汪涛表示，2026年是移动通信技术发展一个重要拐点，产业界在推进5G-A持续迭代，预计2027年3月正式启动3GPP R21，制定面…

06-28

每月68元解锁高效模式：专业版豆包如何化身职场“全能助手”

06-28

DeepSeek开源DSpark及DeepSpec框架，模型生成速度大幅提升并降低落地门槛

06-28

AI浪潮席卷通信业：从“卖连接”到“新价值”，6G时代如何破局？

06-28

罗博网联亮相同力2026海外客户节矿山无人驾驶V3.0方案开启新征程

06-28

点击查看更多 +

全站最新

内存涨价潮下手机价格攀升，当下购机抉择：早买享实惠，不买等降价？

零跑D99高配登场，朱江明谈成本压力：二季度毛利率可控，终端或调价

岚图追光S实车登场纯电中大型SUV市场再添劲敌与小米YU7谁更胜一筹？

全新一代宝马X5 6月30日或全球首发多种动力可选国产版信息同步披露

军工基因融合华为智能猛士M817上市重新定义高端越野新标杆

电动小钢炮的较量：Alpine A290 GTS与MINI JCW谁能更胜一筹？

热门内容

本栏最新

尊界S800典藏大观亮相：余承东“双态”发布，中国超豪华车新征程启幕

敦煌大漠燃情夜：许巍助阵捷途“方盒子”燃油插混双车闪耀登场

360潘剑锋：智能体时代安全新范式，聚焦驾驭AI不确定性难题

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

国产存储系统闪耀ISC2026：国家超算互联网ParaStor双榜夺冠领跑全球

领益智造港股上市募资超82亿港元加速布局AI硬件新赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

DeepSeek又变强了：发布DSpark框架 推理速度提升超60%

DeepSeek又变强了：发布DSpark框架推理速度提升超60%