滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek新招DSpark：不拼模型拼速度，推理成本优化新路径来了

时间：2026-07-02 05:44:59 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

DeepSeek近日公开了DSpark技术报告及DeepSpec代码库，引发AI领域对推理优化的新讨论。此次发布的DSpark并非新模型，而是为DeepSeek-V4底座模型新增的服务端推测解码模块，旨在提升模型上线后的响应速度与成本效率。

根据技术报告，DSpark已部署于DeepSeek-V4线上服务系统。在真实用户流量测试中，相比上一代推测生成方案MTP-1，V4-Flash的每用户生成速度提升60%至85%，V4-Pro提升57%至78%。但需注意的是，这一速度提升主要针对生成阶段，即模型输出token的环节，长提示词预处理、检索、工具调用等环节仍会影响整体响应时间。

AI行业正从训练成本竞争转向推理成本优化。模型训练如同一次性工程，而推理则像持续消耗的“水电费”——只要用户发起请求，模型就需消耗算力。大模型服务的核心指标逐渐聚焦于速度与单位token成本，API定价通常按输入输出token分别计费，企业内部分拆模型、缓存、路由等成本项时，推理效率直接影响商业化可行性。

技术突破体现在草稿生成策略的优化。现有方案分为自回归与并行两类：前者通过前文预测后文，延迟随草稿长度增加；后者一次性生成整段候选，但各位置独立预测导致接受率下降。DSpark采用“半自回归生成”，先并行提出候选，再通过轻量顺序层修正后续token的条件关系，兼顾速度与连贯性。系统会根据候选置信度与当前负载动态调整验证长度——GPU空闲时多验证，负载高时聚焦高概率候选，避免算力浪费。

DSpark并非完全独立的技术路线，而是对现有推测解码方案的集成与创新。SpecInfer早在2023年将小模型预测与并行验证引入服务系统；Medusa于2024年提出多解码头预测后续token；EAGLE系列通过动态草稿树提升接受率。推理框架如vLLM、SGLang也已将推测解码作为降低延迟的工具。DSpark的独特性在于同时解决草稿生成、连贯性保持、负载适配等生产问题，技术指标从“模型能力提升”转向“每用户生成速度”“匹配吞吐”等服务侧词汇。

与DeepSeek-V4同步开源的DeepSpec代码库，提供了训练与评估推测解码草稿模型的完整流程，并公开了Qwen3、Gemma等模型的相关检查点。但项目文档明确提示，复现需满足严格条件：默认Qwen3-4B配置下目标模型缓存接近38TB，训练脚本假设单节点8张GPU，对齐论文结果需完全一致的训练设置，特定领域还需额外微调草稿模型。这意味着，线上服务中的速度提升数据源于DeepSeek自身的硬件规模与流量分布，开源内容更多是方法论而非环境复现。

社区讨论聚焦于技术边界与复现难度。AI研究者Ravid Shwartz Ziv指出，DSpark通过置信度判断头与负载感知调度器，在并行与自回归草稿器间取得平衡，且保持无损特性。工程师Rafael Caricio在双DGX Spark GB10上运行V4-Flash的DSpark模式，单流解码速度达60 tok/s，约为MTP-1的1.5倍，但同时提到长上下文场景下草稿接受率显著下降。Tech2Wild的现场数据也显示，结果高度依赖硬件型号、框架版本、上下文长度等变量，换环境后差异可能极大。

推理优化正成为AI公司竞争的新维度。当模型能力差距缩小，如何以更低成本、更快速度交付服务成为关键。DSpark的价值在于证明，同等能力下可减少推理算力浪费——这延续了DeepSeek一贯的低成本高效路线。从模型训练到API定价，外界关注的焦点已从参数规模转向成本效率。

开源模型生态同样受益。过去，开源模型常被视为“便宜选项”，但实际部署时显存、吞吐、延迟等成本问题凸显。DeepSpec公开Qwen3、Gemma等检查点，表明推理优化已突破单一模型范畴。尽管迁移效果取决于社区适配、框架支持与硬件兼容性，但DSpark至少为开源推理降低成本提供了可行路径。当其他框架与硬件跟进，推测解码或从企业工程选择演变为行业通用手段。

07-02

2026WAIC“AI创新者思享汇”：从共生到协同，共绘人机关系新蓝图

07-02

孙周兴复旦演讲：探寻AI无法触及之地，不可数字化哥德尔信息成关键

07-02

国产算力新突破！海光信息携手同济大学，AI4E千卡集群助力工程智能升级

【环球网科技报道记者李文瑶】6月25日，上海同济大学，海光信息与同济大学正式签署战略合作协议，挂牌成立全国首个“高校海光算力优化中心”，共建国内首个国产千卡工科智算集群。此次千卡集群的落地，不仅填补了…

07-02

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

07-02

优必选CEO预测：未来机器人将主导工作，20余款超仿生人形机器人亮相

07-02

米哈游于上海新设舒俱科技公司注册资本千万聚焦多领域开发

07-02

松下押注AI领域！官宣5000亿日元投资，目标AI基建销售额达1.4万亿日元

07-02

Figure 03进驻宝马工厂：以创新技术解锁物流新场景，赋能汽车生产新未来

07-02

优必选发布全球首款全尺寸超仿生人形机器人U1系列盘中股价涨超17%

上证报中国证券网讯（记者何治民杨子晏）6月30日午后，优必选震荡拉升，截至14时22分，该股涨17.51%，报112.4港元/股。消息面上，6月30日下午，优必选发布全球首款全尺寸超仿生人形机器人U1系…

07-02

英伟达中国大规模招揽机器人人才，具身智能领域高薪“抢人”进行时

具身智能团队开放岗位最多，共6个职位；仿真方向开放4个岗位；部署方向同样设4个岗位；解决方案架构方向设2个岗位，负责向各行业输出英伟达技术方案。目标是打造机器人领域的安卓生态，覆盖工业机械臂、四足与人形机器…

07-02

超仿生人形机器人：99%的完美背后，那1%的人性为何无法复制？

跟进厂干活的工业级人形机器人不一样，它走的是情感陪伴赛道：但那时候，它就是个完美恋人了吗？机器人越像人，越暴露它永远缺的那1%。但它永远无法拥有鲜活的人性。现在的工业制造、AI 算法、精密加工，已经强大…

07-02

99万“天价”陪伴机器人引热议，优必选冲刺万亿家庭市场胜算几何？

最近，2个“万亿”引起市场的关注，一个是寒武纪市值突破万亿，另一个是“人形机器人第一股”优必选发布的陪伴机器人新品，想要冲刺万亿超仿生机器人市场。面向未来的万亿市场，优世界U1进行了一次探索，1.3万的订单…

07-02

优必选周剑谈人形机器人：家庭场景潜力大，当下聚焦情感陪伴正当时

如果一定要分的话，我觉得50%的精力在商业和工业，还有50%是在家庭，我们三条腿都在做。这也让我看到一个机会，中国无论在AI、物理世界构建、数据场景，还是本体制造，我们有些公司量产了几千台上万台，而海外公司…

07-02

博雷顿智驾大模型亮相新疆 “算电双驱”引领矿山智能化新变革

业内人士表示，智驾大模型的发布，意味着博雷顿正在推动矿山无人驾驶从规则驱动走向模型驱动，从单车智能走向车队协同，从人工经验走向数据决策，从局部优化走向全局优化。业内人士认为，这场发布会标志着博雷顿正在把多…

07-02

点击查看更多 +

全站最新

2026年三款AI智能降噪助听器深度测评：精准匹配需求，开启清晰聆听新体验

全新一代天工08预售开启！17.98万起，家庭高品质纯电生活轻松享

鑫源向上V6：小众品牌打造刚需神车，能否在巨头夹击中突围？

新款红旗天工08 670 Max预售开启限时优惠+多项权益智能豪华新选择

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

热门内容

本栏最新

学而思2026旗舰点映会：AI家教新方案亮相，T6系列学习机引领教育新潮流

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

岚图泰山X8纯电版7月交付，配置拉满，30万级SUV市场激战将启

iCAR V27首轮大规模OTA升级来袭智能驾驶等140余项功能焕新升级

iCAR V27首轮大规模OTA升级来袭智能驾驶安全座舱全面焕新升级

缤果PRO上市月余车主反馈：好看好开又实用，城市代步新选择

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.