滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

DeepSeek联合北大清华发布DualPath框架：解锁智能体推理新速度

时间：2026-02-27 15:24:29 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在智能体应用场景中，对话轮次增加与上下文长度扩展已成为常态，但传统推理架构却因此面临严峻挑战。研究团队发现，当KV-Cache命中率超过95%时，系统性能的瓶颈已从计算能力转向数据搬运效率。实验数据显示，在现有预填充-解码分离架构中，预填充引擎的存储网卡带宽常因过度使用而饱和，而解码引擎的同类资源却处于闲置状态，这种资源错配直接导致推理效率受限。

技术实现层面，该框架采用三组件协同架构。推理引擎模块严格区分预填充与解码功能，每块GPU对应专属引擎；流量管理器负责跨设备数据传输与存储读写；中央调度器则扮演决策中枢角色，根据实时网络状态与计算负载，为每个请求智能选择最优传输路径。这种分层设计既保证了专业功能的高效执行，又通过全局调度实现了资源利用最大化。

针对双路径可能引发的流量冲突问题，研究团队提出双重优化机制。在硬件层面，通过计算网卡（CNIC）强制所有流量经GPUDirect RDMA路径传输，并利用虚拟层技术为推理通信分配99%的带宽优先级。在软件层面，自适应调度器持续监测各节点磁盘队列长度与Token处理量，优先将任务分配给I/O压力小且计算负载轻的节点，从根源上避免资源拥塞。

该研究的第一作者为北京大学博士生吴永彤，其研究方向聚焦于大模型基础设施的工程优化。目前他在DeepSeek系统组参与下一代推理框架开发，负责多硬件平台的性能调优工作。这段学术与产业结合的经历，使其能够精准把握系统软件优化与规模化部署的关键痛点。

更多>同类资讯

AI“侦探长”上线：多探员并行搜证，精准工具翻阅锁定最优解

04-23

AI量子编程大挑战：三大框架谁更让AI“头疼”？

04-23

NVIDIA推SPEED-Bench评测体系：破解大模型推理加速评测难题

04-23

AI文字生成新策略：巧妙调度模型，兼顾质量与效率的智慧之选

04-23

地平线“三箭”布局：从芯片到系统，抢占整车智能新赛道关键位

04-23

速腾聚创发布“创世”架构及两款芯片，激光雷达开启图像化感知新篇章

04-23

AI时代阅读新解：以精读深耕自我，在“主动狩猎”中收获成长

04-23

OpenAI意外“剧透”：GPT-5.5等多款前沿AI模型提前现身Codex CLI终端

04-23

OpenAI拟投至多15亿美元入股私募合资企业发力企业AI工具市场

04-23

特斯拉车机语音服务升级：豆包大模型助力，DeepSeek模型提供AI互动新体验

04-22

Anthropic加速开发常驻AI智能体Conway 或将打造跨平台模块化新体验

04-22

别克至境E7上市！大五座布局配插混系统，权益价15.49万起

04-22

阿维塔06T旅行车上市！21.29万起售，华为赋能智驾动力双升级

04-22

中国长安自我重构：以“1445”计划冲刺全球汽车竞争新高度

04-22

荣威家越07概念车亮相：以昂扬美学与AI原生，开启家庭智能出行新篇章

04-22

点击查看更多 +

全站最新

钛动科技获农行百亿授信！一张对民营AI科技企业的"信心投票"

公告精选︱顾家家居：拟不超11.88亿元投资建设产业总部项目；沪电股份：一季度净利润12.42亿元同比增长62.9%

江西铜业股份(00358.HK)获贝莱德增持3.4万股

京东AI新探索：实习生挑大梁，大厂抢人从“0到1”培养开始

盒马自研一体化牛奶新包装，减纸超四成，环保与体验双提升

京东与松延动力强强联合共绘人形机器人全场景应用与普及新蓝图

热门内容

本栏最新

别克至境E7上市！大五座布局配插混系统，权益价15.49万起

阿维塔06T旅行车上市！21.29万起售，华为赋能智驾动力双升级

中国长安自我重构：以“1445”计划冲刺全球汽车竞争新高度

荣威家越07概念车亮相：以昂扬美学与AI原生，开启家庭智能出行新篇章

别克至境E7上市：大五座插混SUV，续航超长配置丰富权益价诱人

阿维塔06T正式登场！未来美学设计，多种动力可选，现金权益后21.29万起

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.