滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

北大携手DeepSeek开源DSpark框架，破解大模型推理难题提升交互体验

时间：2026-06-28 14:46:26 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

北京大学与深度求索公司近日联合发布了一项名为DSpark的大模型推理加速框架，并宣布将其开源。这项技术针对大语言模型在高并发场景下的推理效率问题提出了创新解决方案，能够在保持同等吞吐量的前提下，将单用户文本生成速度提升60%至85%。相关研究论文和训练代码已在GitHub平台公开共享，为行业提供了可复用的技术方案。

当前主流大语言模型普遍采用自回归生成机制，每个文字单元的生成都需要完整的前向运算过程，导致对话响应延迟较高。尽管推测解码技术被视为提升效率的主要路径，但现有方案存在明显缺陷：串行草稿模型随着文本长度增加候选生成耗时显著上升，并行草稿模型则面临长序列候选接受率急剧下降的问题，最终造成高并发场景下的算力资源浪费和系统吞吐量瓶颈。

DSpark框架通过双重优化机制突破技术瓶颈。在候选生成阶段，采用半自回归架构结合改良并行主干网络，可一次性输出候选基础特征，同时通过轻量化顺序模块补充文本前后依赖关系。实验表明，仅需两层Transformer结构即可超越五层传统并行模型的性能表现。在验证调度环节，创新设计的置信度调度验证机制通过硬件感知前缀调度器，根据实时算力负载和候选存活概率动态分配计算资源，优先处理高可靠性文本片段，有效减少无效计算损耗。

多场景测试验证了该框架的优越性。研究团队选取通义千问3、Gemma4等主流模型进行数学推理、代码编写和日常对话任务测试。结果显示，DSpark在单轮有效生成长度指标上全面超越Eagle3和DFlash等基线模型。以Qwen3-4B模型为例，其生成长度较Eagle3提升30.9%，较DFlash提升16.3%，既保持了并行架构的首位生成优势，又解决了长序列候选有效率衰减问题。

工程实现方面，研发团队完成了多项底层优化。训练阶段通过改进数据传输逻辑和采用序列打包策略，显著降低了算力与内存消耗；部署端设计的异步调度模式成功规避GPU流水线卡顿，通过逻辑与物理计算解耦满足动态变长验证需求，兼容主流CUDA硬件生态。这些优化使得框架能够灵活适配不同硬件环境，为实际部署提供了技术保障。

目前，DSpark框架已应用于DeepSeek-V4-Flash和DeepSeek-V4-Pro预览版服务引擎。线上实测数据显示，在不同用户响应速度标准下，系统吞吐量实现显著提升：V4-Flash引擎在保障80token/s生成速度时，吞吐量较原有基线提升51%；当要求120token/s高速输出时，吞吐量优势达661%。V4-Pro引擎在35token/s和50token/s标准下，吞吐量分别提升52%和406%。系统具备自适应调节能力，可根据在线并发量自动调整验证文本长度，在低负载时充分释放算力，高负载时平滑控制资源竞争。

尽管DSpark在复杂低适配查询场景下仍存在固定算力开销，但深度求索公司已通过GitHub平台开源全套训练代码、评估工具和模型权重，涵盖DSpark、DFlash、Eagle3三个技术方案。这一举措为行业低成本部署高性能大模型推理服务提供了完整技术路径，有助于降低人工智能应用的线上部署成本，提升终端用户的交互体验。

更多>同类资讯

Anthropic调研：AI深度融入办公近半Claude用户工作过半由AI分担

06-28

华为联合多方发力AI领域：提升体验、成立联盟，共促产业高质量发展

06-28

DeepSeek联合北大发布DSpark：大模型推理加速新突破，让AI输出更流畅

06-28

AI记录打工人的24小时：凌晨失眠求助，傍晚焦虑晚餐，周末怀揣创业梦

06-28

Anthropic调研：Claude用户眼中AI成工作好帮手协同未来受期待

06-28

OpenAI携手Broadcom推出Jalapeno芯片专攻大语言模型推理新赛道

作为ChatGPT和Codex等产品的背后推手，该公司致力于掌控其模型与产品所依赖的完整技术栈，从而降低对英伟达等外部供应商的依赖，并通过垂直整合在性能或效率上获得潜在优势。 A：根据OpenAI和Broad…

06-28

Adobe强化AI布局：收购Topaz Labs，整合技术提升创意软件生态竞争力

此次收购完成后，Adobe计划将Topaz的AI模型进一步整合至FireflyAI应用及其他图像与视频编辑产品中，同时也将通过官网继续提供Topaz旗下产品的独立服务。 A：收购完成后，Topaz Labs…

06-28

苹果Vision Pro项目核心高管保罗·米德下周离职，将转投OpenAI硬件部门

最近一段时间，他主要负责推进 AI 智能眼镜项目，并领导 AR 眼镜开发团队。现任 Vision Pro 与智能眼镜产品设计负责人弗莱彻 ·罗斯科夫（IT之家注：Fletcher Rothkopf）将接手他…

06-28

深圳“智造者大会”展新篇：微型传感器赋能机器人“触觉”升级

华力创科学的方案，就是把传感器“微缩”到了8.5毫米直径、最薄仅5毫米，像一颗纽扣大小，却能感知多维力变化。最新的Photon Finger tip则更进一步，把“刚性力觉”和“柔性电子皮肤”融合在一起，真正…

06-28

荣耀Robot Phone机器人手机8月将至研发历经一年打磨且后续计划迭代升级

IT之家 6 月 28 日消息，博主 @旺仔百事通昨晚发文透露，称荣耀 Robot Phone 机器人手机将在 8 月上市。有网友询问这台手机后续是否还会迭代，博主明确表示：“会。” 荣耀机器人手机 Ro…

06-28

开源程序新创意：Steam手柄“变身”自动充电小能手震动寻底座超便捷

IT之家 6 月 28 日消息，一名航空航天从业者兼程序员在 GitHub 上发布了一款程序，只要把 Steam手柄放在桌面，它就能自动朝着充电底座缓慢移动。此前已有其他程序员制作过同类创意网页工具，利用…

06-28

共启AI Token新生态：中国电信国际伙伴大会聚力，共绘全球智能新蓝图

本次大会标志着OneGrowth全球合作计划完成了从生态搭建到细分赛道深耕的战略进阶，中国电信将持续发挥云网融合、跨境广覆盖的独特优势，秉持“共创、共享、共治、共赢”核心合作理念，筑算力根基、拓云网骨干、创…

06-28

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

一位通信设备厂商的技术负责人对第一财经记者表示，从经营流量到经营Token，包括运营商在内的通信产业链玩家不再甘于只做个连接服务商。“过去几年，5G提供了差异化服务的机会，但真正完成5G独立组网、能够把网络能…

06-28

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

央广网长春6月27日消息（记者张学龙）26日，由华为技术有限公司主办、吉林建筑科技学院承办的“数智赋能·人才兴吉——2026产教融合创新发展论坛暨华为院校人才培养论坛”在吉林建筑科技学院国际会议交流中心举行。…

06-28

神舟二十三乘组在轨满月：科研稳步推进，太空生活丰富还吃上了烤南瓜

06-28

点击查看更多 +

全站最新

新能源商用车+智能运营：物流行业绿色数智转型的苏州探索

智美大五座豪华SUV来袭！阿维塔07L明日直播揭秘鸿蒙座舱内饰

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

科大讯飞P30 Turbo学习机：护眼AI双加持，助力孩子高效学习新选择

启境GT7入局车市内卷红海，性价比与配置能否助其破局突围？

热门内容

本栏最新

AI浪潮席卷通信业：从“卖连接”到“卖智能”，新价值如何破局？

吉林建科携手华为共探数智人才培养新路径助力区域数字经济高质量发展

尊界S800典藏大观亮相：余承东“双态”发布，中国超豪华车新征程启幕

敦煌大漠燃情夜：许巍助阵捷途“方盒子”燃油插混双车闪耀登场

360潘剑锋：智能体时代安全新范式，聚焦驾驭AI不确定性难题

华为赵振龙：AI驱动自智网络双核心演进，无线网络智能体引领行业新未来

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.