ITBear旗下自媒体矩阵:

DeepSeek开源DSpark及DeepSpec框架,模型生成速度大幅提升并降低落地门槛

   时间:2026-06-28 04:48:02 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,人工智能领域迎来两项重要技术突破:DeepSeek正式开源推测解码框架DSpark与训练框架DeepSpec,并同步发布基于这两项技术优化的DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark两款模型。其中DSpark框架由北京大学团队参与联合研发,相关技术论文已对外公开。

DSpark框架的核心创新在于其半自回归架构设计。该架构通过将并行主干网络与轻量化串行模块相结合,在保留并行计算效率优势的同时,建立了块内token的依赖关系。这种设计有效缓解了传统并行解码中常见的末尾内容质量衰减问题。为进一步提升解码稳定性,研发团队引入了动态置信度调度机制,该机制可根据前缀内容的通过概率与系统实时吞吐特征,自动调整校验长度,确保解码过程在速度与质量间取得平衡。

在DeepSeek-V4线上服务系统的部署测试中,DSpark框架展现出显著性能提升。数据显示,在保持系统整体吞吐量不变的前提下,单用户内容生成速度提升幅度达60%至85%。特别值得注意的是,该框架在严格交互时延约束条件下,仍能维持系统吞吐率的稳定性,成功突破了服务系统性能优化的传统边界限制。

同步开源的训练框架DeepSpec则聚焦于降低技术落地门槛。这个全栈代码库整合了数据预处理、模型训练及效果评估的完整工具链,采用MIT开源协议授权。目前该框架已实现对DSpark、DFlash和Eagle3三种推测解码算法的支持。开发者可利用DeepSpec为Qwen3、Gemma等主流模型训练定制化草稿模型,显著简化推测解码技术的实施流程。据开发团队介绍,该框架的模块化设计使其能够快速适配新的模型架构,为AI应用的多样化发展提供技术支撑。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version