滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek开源DSpark框架：破解AI“挤牙膏”难题，推理加速再升级

时间：2026-06-28 09:11:52 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

近日，专注于大模型研发的DeepSeek与北京大学研究团队联合发布了一项重要成果——新型推理加速框架DSpark，相关论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》已在学术平台公开。该技术已应用于DeepSeek-V4-Flash preview和DeepSeek-V4-Pro preview的生产服务系统，并取代了原有的MTP-1方案。据实测数据显示，在系统总吞吐量持平的条件下，DSpark使DeepSeek-V4-Flash的单用户生成速度提升60%-85%，V4-Pro版本提升57%-78%，显著优化了高交互场景下的用户体验。

传统语言模型普遍采用自回归生成方式，每个新token的生成都依赖前文计算结果，导致输出长度增加时解码延迟显著累积。这种特性在实时对话、多轮智能体工作流等场景中尤为突出，既影响用户感知也降低GPU利用率。为突破这一瓶颈，学术界提出了推测解码技术，其核心思路是通过轻量级草稿模型预先生成候选token序列，再由主模型批量验证，从而减少主模型的前向计算次数。然而现有方案存在明显缺陷：自回归草稿模型虽能保证候选质量，但生成速度受限；并行草稿模型虽快，却容易产生语义不连贯的组合，导致后续token被拒率随长度增加而急剧上升。

针对这些痛点，DSpark创新性地采用半自回归架构。该架构在保留并行计算优势的基础上，通过引入轻量级顺序模块增强候选序列的内部关联性。具体而言，系统先利用并行网络快速生成初始候选，再通过马尔可夫头或RNN头对相邻token的衔接关系进行局部修正。实验表明，这种设计在数学推理、代码生成等结构化任务中效果显著，候选token的平均接受长度较纯并行方案提升16%-18%，较自回归方案提升26%-30%。

在验证环节，DSpark引入了基于置信度的动态调度机制。系统会为每个候选位置预测置信分数，反映在当前位置前序token均被接受的前提下，该位置继续被接受的概率。硬件感知前缀调度器则根据实时系统负载、置信度分布及吞吐曲线，动态调整每个请求的验证长度。当系统资源充裕时，优先验证高置信度请求的更长前缀；负载高峰时，则缩短低置信度请求的验证长度，避免无效计算占用批处理容量。这种设计使DSpark在不同并发场景下均能保持稳定性能，在线上测试中，V4-Flash在80 token/s/user的服务目标下，系统总吞吐量提升51%；在120 token/s/user的严苛条件下，名义吞吐优势达661%。

离线实验覆盖了Qwen3-4B、Qwen3-8B、Qwen3-14B和Gemma4-12B四个主模型，测试场景包括数学推理、代码生成和日常对话。结果显示，DSpark在宏平均接受长度指标上全面领先：数学任务达5.57，代码任务5.12，对话任务3.49。结构对比实验进一步验证了设计有效性——2层DSpark模型的性能已超越5层并行草稿模型，且随着候选长度从4扩展至16，其优势持续扩大。延迟测试表明，顺序模块带来的额外开销极小，在batch size 128条件下，单轮延迟仅增加0.2%-1.3%，但接受长度提升最高达30%。

目前，DeepSeek已开源DSpark的模型权重及配套训练代码库DeepSpec，包含Eagle3、DFlash和DSpark三种推测解码方案的完整实现。这一举措将推理加速领域的竞争从单纯的模型结构创新推向系统级优化阶段。行业分析指出，随着大模型应用场景向高并发、低延迟方向延伸，单纯追求模型参数规模已不足以建立竞争优势，如何通过软硬件协同优化提升推理效率，将成为决定产品市场表现的关键因素。DeepSeek此次开源不仅提供了可复用的技术方案，更揭示了生产环境部署中需要考虑的复杂变量，为行业树立了新的参考标准。

更多>同类资讯

机器人产业热潮涌动：百万年薪揽才背后，泡沫与机遇并存

06-28

Anthropic调研：Claude用户眼中AI成工作好帮手协同发展成期待

06-28

选购二手KUKA焊接机器人必看：精准匹配工况，确保状态真实，强化后期保障

许多采购者往往只关注价格和品牌，却忽略了设备与自身实际焊接工艺（如不锈钢的特定要求）及生产节拍的契合度。作为在工业机器人集成领域深耕多年的服务商，天津理想动力科技有限公司基于大量的项目实践观察到，成功的二手设…

06-28

依必安派特战略转型显成效：剥离低利润业务，营收增长目标直指30亿欧元

06-28

Anthropic调研：Claude用户眼中AI成工作好帮手协同发展成期待

06-28

仓库自动搬货箱机器人主流技术路线解析：参盘、Figure AI、Apptronik方案对比

汽车制造产线物料搬运零部件配送与产线其他设备协同作业路线特点总结：从汽车制造这一高要求场景切入，通过与头部车企合作验证技术。对于关注“仓库里自动搬货箱的机器人”技术选型的用户来说，参盘科技的WAM路线提供…

06-28

16亿收购烟台LNG企业，1000万潍坊设厂，重庆机器人“小巨人”山东布局显锋芒

2025年12月，七腾机器人及其一致行动人抛出方案，计划合计出资约16.86亿元，通过“协议转让+部分要约收购”的组合拳拿下控制权。收购一家亏损的LNG公司，又火速在潍坊落子，七腾机器人要的显然不是LNG业…

06-28

华为汪涛：2026成移动通信拐点，2027年将制定未来二十年新标准

6月24日，在2026世界移动通信大会上海期间，华为副董事长、轮值董事长汪涛表示，2026年是移动通信技术发展一个重要拐点，产业界在推进5G-A持续迭代，预计2027年3月正式启动3GPP R21，制定面…

06-28

每月68元解锁高效模式：专业版豆包如何化身职场“全能助手”

06-28

DeepSeek开源DSpark及DeepSpec框架，模型生成速度大幅提升并降低落地门槛

06-28

AI浪潮席卷通信业：从“卖连接”到“新价值”，6G时代如何破局？

06-28

罗博网联亮相同力2026海外客户节矿山无人驾驶V3.0方案开启新征程

06-28

AI助力宇宙探索：迁移学习加速新物理发现，也面临负迁移挑战

迁移学习允许人工智能系统将从一项任务中获得的知识应用到另一项任务中，以帮助其更高效地学习。这个初始训练过程被称为预训练，为人工智能打下了基础，之后再让它接触包含可能的新物理的更复杂宇宙学模型。正如作者在论…

06-28

吉林建科携手华为举办产教融合论坛共探AI时代人才培养新路径

央广网长春6月27日消息（记者张学龙）26日，由华为技术有限公司主办、吉林建筑科技学院承办的“数智赋能·人才兴吉——2026产教融合创新发展论坛暨华为院校人才培养论坛”在吉林建筑科技学院国际会议交流中心举行。…

06-28

MWC上海：时空道宇全栈开源生态引领商业航天从“拼量”到“拼生态”新变革

06-28

点击查看更多 +

全站最新

内存涨价潮下手机价格攀升，当下购机抉择：早买享实惠，不买等降价？

零跑D99高配登场，朱江明谈成本压力：二季度毛利率可控，终端或调价

岚图追光S实车登场纯电中大型SUV市场再添劲敌与小米YU7谁更胜一筹？

全新一代宝马X5 6月30日或全球首发多种动力可选国产版信息同步披露

军工基因融合华为智能猛士M817上市重新定义高端越野新标杆

电动小钢炮的较量：Alpine A290 GTS与MINI JCW谁能更胜一筹？

热门内容

本栏最新

尊界S800典藏大观亮相：余承东“双态”发布，中国超豪华车新征程启幕

敦煌大漠燃情夜：许巍助阵捷途“方盒子”燃油插混双车闪耀登场

360潘剑锋：智能体时代安全新范式，聚焦驾驭AI不确定性难题

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

国产存储系统闪耀ISC2026：国家超算互联网ParaStor双榜夺冠领跑全球

领益智造港股上市募资超82亿港元加速布局AI硬件新赛道

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.