滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

小红书RedKnot引擎开源：破解长文本难题，推理速度与效率双提升

时间：2026-06-30 13:40:34 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在生成式人工智能领域，处理超长文本时的效率与成本问题长期困扰着技术团队。近日，小红书技术团队宣布开源其自主研发的RedKnot推理引擎，通过架构创新为长上下文任务提供了新的解决方案。该引擎通过优化底层计算逻辑，显著降低了内存占用并提升了推理速度，尤其适用于需要处理海量文本的场景。

传统大模型在推理过程中，通常采用按词元（token）维度存储的KV Cache机制。这种模式在处理短文本时表现良好，但当输入长度超过一定阈值后，内存消耗会随文本长度线性增长，导致推理速度下降且并发能力受限。RedKnot突破了这一局限，其核心创新在于将KV Cache沿注意力头维度拆解，并引入“头分类稀疏”“稀疏FFN”和“SegPagedAttention”三项关键技术。这些机制通过统一算法逻辑与存储粒度，实现了计算资源的高效利用。

实际测试数据验证了RedKnot的性能优势。在配备8块H800显卡的高性能计算环境中，该引擎将首字生成时间（TTFT）缩短至原来的1/1.6至1/3.54，单卡并发能力提升至4.7倍至7.8倍。在预填充阶段，其计算资源消耗（FLOPs）减少67%至79.5%。以DeepSeek-V4-Flash模型在128K超长上下文任务中的表现为例，RedKnot使其首字生成速度提升5.16倍，KV数据传输效率优化6.3倍，同时推理精度保持在稠密模型95%以上的水平。

行业分析师指出，RedKnot的开源为AI推理引擎的工程优化提供了重要范本。在当前算力资源紧张的背景下，通过底层架构创新降低长文本处理门槛的思路，为构建更轻量、更高效的AI系统开辟了新路径。该团队已将完整代码公开，旨在加速长文本AI应用的技术普及与产业落地。

更多>同类资讯

民用技术赋能军事变革：单级固推低成本化，或成未来战争新“利器”

06-30

投8000份简历无果美名校毕业生：AI成找工作拦路虎

06-30

高通首款2nm芯片登场！骁龙8E6定档9月22日

06-30

苹果与Optis 4G专利侵权诉讼拉扯七年，英最高法院开庭审理

06-30

首发2nm骁龙8E6 Pro！小米18系列预计9月24日发布

06-30

雷军回应小米SU7 Ultra纽北成绩：产品要媲美保时捷特斯拉

06-30

梁汝波发全员邮件：字节时隔4年更新领导力原则

06-30

消息称小红书启动“达尔文”创业孵化项目

06-30

豆包App上线导航功能：语音文字输入即启，支持悬浮小窗多任务并行

06-30

抖音“验证助手”升级啦！新增语音识图功能，助力老年用户轻松反诈

06-30

字节跳动更新领导力原则：强调实质产出，引领AI时代新使命

06-30

中国移动成立Token办公室战略布局，集团核心领导挂帅引领新发展

06-30

京东旗下公司在济南成立涉量子计算等多领域业务

06-30

昆虫体质检测新突破：北京斯佩德康技术赋能蛐蛐育种与具身智能研究

其核心适配价值体现在：拥有从硬件（微力检测仪、致密度分析设备）到算法（AI斗虫小程序）的完整方案，且已有具身智能领域的跨学科应用案例，能够为采购方提供技术演进的可能性。一是设备所采用的传感技术原理，如是否基于…

06-30

小红书内部“达尔文”项目启动，员工脱产孵化或能直接出任产品负责人

06-30

点击查看更多 +

全站最新

地平线HSD V2.0：以迭代效率与双引擎驱动，开启智驾自主进化新篇章

短途电动车怎么选不踩坑？按需挑选这三类，轻松省下冤枉钱！

HSD V2.0迭代升级：以世界模型与强化学习开启智驾自主进化新篇

Jeep未来四年规划曝光：推三款新车布局欧洲与东风共铸大型SUV

晟兴电话机器人助力资料补全：小步试跑精准优化，让人机协作更高效自然

2026汽车音响低音炮升级指南：新能源与MPV低频优化服务商如何选？

热门内容

本栏最新

三十年技术路被冠“营销大师”名号，雷军直播直抒胸臆：听到“营销”就犯恶心

校地携手共谱美育新篇！河北科技学院“中国经典民歌展演校园公益行”引关注

小屏旗舰新突破！小米18工程机7200mAh大电池，9月或提前迎战iPhone 18 Pro

小米18工程机配置曝光：6.4英寸小屏配7200mAh电池，小屏旗舰或迎新突破

科大讯飞研究院2027届「飞星计划」正式启航邀你共赴AI新征程

2027款星海V9获国际名流青睐，以实力推动20万级MPV豪华体验新跨越

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.