MIT递归语言模型：让AI像人类一样“翻书做笔记”处理超长文本

时间：2026-01-10 00:34:44 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

麻省理工学院计算机科学与人工智能实验室（CSAIL）的研究团队提出了一种突破性方法，旨在解决大型语言模型处理超长文本时面临的“上下文腐烂”难题。这项发表于arXiv平台的研究（编号：2512.24601v1）显示，通过引入递归语言模型（RLM），AI系统处理长文本的能力实现了两个数量级的跨越，同时保持成本可控甚至更低。

传统语言模型在面对长文本输入时，性能会随文本长度增加而急剧下降。研究团队将其类比为人类试图一次性记忆整本书内容，最终导致关键信息丢失。新提出的递归语言模型则模仿人类处理复杂任务的方式——通过分解问题、标记重点、按需查阅，而非强行记忆所有细节。这种策略使AI能够像资深编辑审阅长篇小说般，将部分章节交由助手分析，再将结果整合为完整结论。

技术实现层面，递归语言模型将长文本存储在类似“外部图书馆”的环境中，而非直接输入神经网络。AI通过编写代码与文本交互，能够定位特定段落、分析结构并提取关键信息。当遇到需要深入分析的片段时，系统会启动子任务调用自身副本处理，形成多层级递归调用机制。这种设计突破了传统模型上下文窗口的限制，理论上可处理无限长度文本。

实验验证环节，研究团队设计了三类渐进式测试：基础版“单针干草堆”测试要求从海量文本中定位特定信息；进阶版OOLONG测试涉及语义转换与信息聚合；最高难度的OOLONG-Pairs测试则需找出满足复杂条件的成对信息。结果显示，在处理32000词汇的配对任务时，递归语言模型准确率达58%，而传统模型几乎完全失效。代码理解测试中，该模型成功解析了包含90万词汇的软件项目。

成本分析显示，递归语言模型在中位数场景下比基础模型更经济。其通过选择性处理关键信息，避免了传统方法对整段文本的盲目压缩。尽管少数复杂任务可能触发大量递归调用导致成本上升，但研究团队指出，通过异步处理与并行计算可显著优化效率。在文档搜索案例中，处理830万词汇语料库的成本仅0.079美元，较传统方法降低三倍以上。

模型行为观察发现，递归语言模型展现出类似人类研究者的智能特征：使用正则表达式过滤无关信息、基于先验知识定位关键词、通过分工合作处理复杂任务。不同模型呈现差异化策略——Qwen3-Coder倾向对每行文本启动子调用，而GPT-5则更谨慎地权衡调用必要性。所有模型均表现出答案验证习惯，通过小规模上下文核实初步结论的准确性。

技术实现细节方面，研究团队采用Read-eval-Print Loop（REPL）交互环境，将长文本存储为可编程变量。系统提示经过精心设计，引导模型平衡调用频率与处理质量。当前实现虽采用顺序执行模式，但研究指出异步架构可提升效率。模型选择策略显示，混合使用不同规模模型（如GPT-5处理主逻辑、GPT-5-mini处理子任务）能优化成本效益比。

该研究同时指出技术局限性：同步执行模式限制处理速度，递归深度受基础模型约束，部分模型存在上下文管理决策失误。训练数据未针对递归调用优化，导致成本预测难度增加。研究团队建议，未来可通过专门训练方法、异步处理技术与更深层递归机制突破现有瓶颈。

这项创新标志着AI发展路径的重要转向——从单纯扩大模型规模转向优化信息处理策略。递归语言模型通过模拟人类分解复杂问题的认知模式，为处理法律文档分析、科研文献综述等长文本场景提供了新工具。其模块化设计理念与工具型智能发展方向，可能重塑未来AI系统的架构设计。

Q&A环节，研究团队解释：递归语言模型与传统ChatGPT的本质区别在于信息处理方式——前者通过外部存储与代码交互管理信息，后者依赖内部记忆；成本优势源于精准定位关键信息而非全量处理；理论文本处理长度无上限，已实现千万级词汇处理能力。完整技术细节可查阅原始论文（arXiv:2512.24601v1）。

华为计算开源业务总经理李永乐在近日接受采访时表示，华为从2010年开始有组织地使用开源软件，2012年起逐步参与OpenStack等开源项目，2019年和2020年开源openEuler、openGauss等…

在实际体验中，我围绕一个更贴近媒体场景的需求进行了测试：创建一个“跨平台AI产业趋势研究专家”，要求具备数据抓取、新闻来源交叉验证、结构化报告生成能力，同时输出适合公众号长文的结构框架与可视化图表建议。 M…

IT之家 2 月 27 日消息，苹果公司今天（2 月 27 日）正式发布 Xcode 26.3 更新，核心亮点是引入了“自主 AI编码智能体”（AI agents），不仅内置 Swift 6.2.3，更原生…

IT之家 2 月 26 日消息，Sandisk 闪迪与 SK 海力士昨日在闪迪美国总部联合举办“HBF规格标准化联盟启动会”，这标志着两大存储原厂正式启动了高带宽闪存 (HBF) 的全球标准化进程。在传统架…

IT之家 2 月 27 日消息，2 月 26日，广汽集团正式宣布孵化成立广东慧仑科技有限公司（IT之家注：下称“慧仑科技”），携第四代具身智能人形机器人 GoMate Mini 亮相广州开发区、黄埔区高质量…

多伦多大学在其人形机器人项目中采用来福谐波的关节模组，成功实现了灵巧手的精准控制，验证了δ齿形在微型化场景下的卓越性能。未来，来福谐波将继续以δ齿形技术为核心，推动机器人关节模组向更高精度、更长寿命方向发展，…

克罗地亚人形机器人“通卡”25日在萨格勒布鲁杰尔·博什科维奇研究所举办的人形机器人大会上亮相。 2月25日，在克罗地亚萨格勒布鲁杰尔·博什科维奇研究所，万德里机器人公司董事兼联合创始人塔代伊·斯拉普尼克展示…

新京报贝壳财经讯（记者张冰）2月26日，广汽集团宣布孵化成立广东慧仑科技有限公司（简称“慧仑科技”）。作为广汽集团布局具身智能机器人赛道的核心载体，慧仑科技将以独立主体身份开展市场化运营，专注于具身智能机器人…

他表示，这类任务在三个月前仍需要开发者花费整个周末完成。值得注意的是，卡帕西直到 2025 年 10 月仍认为 AI 智能体被过度炒作，但在Opus 4.5 和 Codex 5.2 发布后，他改变了看法。…

意大利艺术家达·芬奇曾设计出一台“具备自主能力的机器骑士”，利用外部动力驱动其体内的滑轮与齿轮，完成移动手臂、下巴甚至是坐起等简单动作。1996年P2亮相，它是世界上第一个将所有设备都集成在自身内部的人形机器…

在网上看到这张华为产品家族全谱系，它的产品名字充满东方韵味:鸿蒙、鲲鹏、麒麟……都是从中国上古奇书《山海经》中汲取的灵感。作为华为的操作系统，它就像盘古开天辟地前的那团鸿蒙之气，为所有智能设备提供了最底层的连…

2026 年 1 月 AI Edge 联盟发布的《AI Edge 需求、愿景与潜在关键技术白皮书》，系统阐述了 AI Edge的发展背景、技术内涵、应用价值及核心技术方向，为 6G 时代通感智算控融合的边缘…

围绕这一目标，我们将静态面扫、动态线扫、高精度RGB、焊缝提取、焊缝跟踪、熔池监测六大功能集成于同一台相机，并通过统一坐标体系让各观测维度共享同一基准，减少多视角、多设备换算带来的误差叠加，同时降低对手眼标…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.