滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

梁文锋参与！DeepSeek联合北大发布DSpark框架提升大模型推理效率与速度

时间：2026-06-28 18:39:41 来源：天脉网编辑：快讯 IP：北京 发表评论无障碍通道

当行业还在聚焦大模型“智力竞赛”时，DeepSeek另辟蹊径，将研发重心转向提升模型推理效率。近日，该团队联合北京大学在GitHub发布最新研究论文，公开了其自研的推理加速框架DSpark，并同步开源模型权重与训练代码，试图破解大语言模型在高并发场景下的性能瓶颈。

论文核心聚焦于自回归生成机制的固有缺陷——每个新词元的生成均需依赖完整前向传播，导致输出越长、延迟越高。这种特性直接引发两大问题：GPU资源利用率低迷，以及用户等待时间呈指数级增长。尤其在实时对话、多轮智能体协作等对延迟敏感的场景中，该问题已成为制约模型落地的关键障碍。

研究团队指出，现有解决方案存在明显短板：自回归草稿模型（如Eagle3）虽能保证生成质量，但系统吞吐量受限；并行草稿模型（如DFlash）虽提升效率，却牺牲了部分输出准确性。更关键的是，两类方案均缺乏动态负载调节能力，难以适应复杂多变的实际需求。

DSpark框架创新性采用半自回归架构，通过融合并行主干与轻量级串行模块，在保持高吞吐优势的同时，逐词元注入前缀依赖信息。该模块提供两种实现路径：马尔可夫头仅依赖前一词元，实现极低计算开销；RNN头则通过循环状态累积完整上下文，平衡效率与准确性。实验数据显示，两层Transformer结构的DSpark在所有测试领域中，均超越五层DFlash的接受长度。

实际部署效果印证了技术突破的价值。在DeepSeek-V4在线服务系统中，DSpark在相同吞吐量条件下，将用户端生成速度提升60%-85%。当该框架应用于阿里Qwen3系列模型时，4B、8B、14B版本的单轮可接受词元长度，较自回归草稿模型分别提升30.9%、26.7%、30%，较并行草稿模型提升16.3%-18.4%。

值得关注的是，DeepSeek创始人梁文锋直接参与论文研究，这从侧面反映出企业对技术落地的重视程度。通过开源模型权重与训练代码，研究团队不仅为学术界提供研究基准，更为工业界部署高效推理系统开辟新路径。这项突破或将重新定义大模型的应用边界——在追求智能上限的同时，通过工程优化释放底层算力潜能。

更多>同类资讯

200万粉农业网红公然诋毁袁隆平育种技术抖音果断出手无限期封禁

06-28

熊猫“Q22F5”21.5英寸显示器上架京东：1080P 120Hz超频，仅售369元

06-28

联想2026款ThinkPad T14p新版本登场：酷睿Ultra X9 388H加持，6月30日开售

06-28

B站迎17周年庆，陈睿称社区是优质内容最好的土壤

06-28

B站举办17周年庆，5分钟以上视频观看时长占比达65%

06-28

全是噱头！马斯克狠批IBM 0.7nm芯片

06-28

IBM宣布0.7nm突破，工程师集体“挑刺”

06-28

智元第15000台通用具身机器人精灵G2量产下线

06-28

录一遍就完事了！手把手带一次，AI学会替你填表刷网页

06-28

抖音通报200万粉丝网红诋毁袁隆平成果：永久封禁

06-28

算力吃紧，消息称谷歌限制了Meta的Gemini使用量

06-28

台积电CoWoS争夺战：英伟达领跑2027，AMD追赶，云厂商入局产业链扩张

06-28

REDMI K90至尊版下周登场：最强风冷+骁龙8E 性能挑战骁龙8E5

06-28

台积电订单排名出炉：英伟达稳居榜首、AMD紧随其后

06-28

互联网内容饱和时代：优质创作成新宠，创作者迎来黄金机遇期

06-28

点击查看更多 +

全站最新

鸿蒙智行尊界SUV谍照新出炉，家族前脸延续，尾灯方案引关注

鸿蒙智行尊界V800与V680亮相华为官网预售开启享2万选配金权益

宝马全新长轴距版X5不止中国有，6月30日首发后将进军印度市场

原生设计破局空间难题 20秒成床广汽华为联手启境GX7开启大五座新篇

长安启源Q05乌兹别克斯坦上市携手共建绿色交通生态助力产业升级

33天铸就传奇！新中国首辆高级轿车即将在中国一汽博物馆展出

热门内容

本栏最新

B站17周年陈睿发声：内容过剩时代社区成优质内容生长沃土

科大讯飞P30 Turbo学习机：护眼AI双加持，助力孩子高效学习新选择

捷达品牌焕新启航：以智能电动为笔，绘就新能源出行新蓝图

2026奶商指数揭晓：银龄悦己小镇家庭崛起，新生代父母喂养升级新动向

内存涨价潮下手机价格攀升，当下购机抉择：早买享实惠，不买等降价？

岚图追光S实车登场纯电中大型SUV市场再添劲敌与小米YU7谁更胜一筹？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

梁文锋参与！DeepSeek联合北大发布DSpark框架 提升大模型推理效率与速度

梁文锋参与！DeepSeek联合北大发布DSpark框架提升大模型推理效率与速度