滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

大语言模型“Token”范式遇天花板，连续空间能否开启AGI新路径？

时间：2026-05-31 00:35:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

“我语言的局限，即意味着我世界的局限。”哲学家维特根斯坦百年前写下的这句话，如今正成为人工智能领域探讨大语言模型发展瓶颈的关键注脚。当AI的“语言”被限定为离散token序列，其认知与能力边界也被同步框定，这一困境让学界与产业界开始重新审视大语言模型能否通向通用人工智能（AGI）的终极目标。

2024年，OpenAI前首席科学家伊利亚·苏茨克维尔在NeurIPS大会上抛出“预训练即将终结”的论断；2026年，图灵奖得主杨立昆（Yann LeCun）离开meta创办AMI Labs，直言“大语言模型路线错误”。两位深度学习领域的标志性人物，一位试图颠覆自己开启的预训练时代，另一位则押注世界模型路线，试图为AI寻找新的突破口。尽管当前大语言模型的用户规模与商业价值持续攀升，但技术路径的天花板已清晰可见——离散token的建模方式，或许正是横亘在通往AGI道路上的关键障碍。

2026年5月，麻省理工学院何恺明团队与字节跳动Seed实验室几乎同步发布研究成果，为打破这一困境提供了实验依据。两篇论文共同指向一个核心结论：语言生成的核心过程无需始终困于离散token空间，转而通过连续嵌入（embedding）或潜在空间（latent space）完成建模，最终再映射回文本，这种范式转换可能带来更高的效率与更广阔的探索空间。何恺明团队的ELF模型仅用32步采样便超越传统离散模型1024步的生成质量，且训练数据量仅为后者的十分之一；字节跳动的Cola DLM则通过纯语义空间的流匹配（Flow Matching）技术，在参数规模与数据量显著低于主流模型的情况下，展现出健康的扩展性曲线。这些成果表明，逐token预测或许只是通向AGI的局部最优解，而连续空间范式可能打开新的可能性。

人类认知的连续性为这一技术转向提供了理论支撑。大脑的认知活动本质上是连续的、并行的、高维的，例如想到“苹果”时，激活的是涉及颜色、质感、重量等多维感官的神经网络，而非“苹果”二字的离散符号。语言作为进化中的“有损压缩协议”，将复杂的连续体验压缩为符号序列，本质上是跨脑传输的工程妥协。当前主流的自回归大模型，正是在这种压缩后的输出格式上建模，其擅长模拟人类语言行为，却难以理解世界运作的底层逻辑——身体感受、空间直觉、因果推理等未被语言编码的维度，始终游离于训练数据之外，成为token范式无法触及的“黑暗大陆”。

科技巨头的战略调整进一步印证了这一趋势。谷歌是最早布局“原生多模态统一”的先行者，其Gemini系列模型从训练阶段便融合文本、图像、音频、视频等多种模态，共享注意力机制，并构建统一的3072维向量空间，试图消除模态间的边界。OpenAI的路径则更为曲折：从GPT-4V的拼接式架构到GPT-5系列强化多模态推理，其虽未完全披露技术细节，但砍掉视频应用、聚焦Agent架构与代码工具的决策，暗示其对高效架构的等待与探索。字节跳动Seed团队则明确提出“离散文本与连续模态统一建模”的路径，其视频生成模型Seedance系列已采用类似架构，依托抖音/TikTok的海量视频数据与前沿研究能力，成为工业级验证连续空间范式的潜在领跑者。相比之下，Anthropic选择回避多模态生成，将资源集中于文本推理与代码执行，虽在商业上取得成功，却可能因技术债积累在未来的竞争中陷入被动。

独立研究者的探索更为激进。苏茨克维尔创办的SSI公司，在无产品、无论文的情况下凭借“下一个范式”的判断力获得20亿美元融资；杨立昆的AMI Labs则延续JEPA路线，强调在抽象空间中预测物理后果，而非生成逼真输出。两者的共识在于：自回归机制的本质是字符级统计复现，参数量的增加无法弥补其结构性缺陷，真正的理解需要从“生成”转向“预测”。

技术范式的转型必将引发产业链的连锁反应。以视频tokenizer为核心业务的公司首当其冲——当语言生成迁移至连续空间，视频等连续数据的离散编码将失去必要性，视觉表征的研究重点将转向如何高效压缩同时保留物理、时序与语义结构。多模态能力也可能从差异化卖点变为基础模型的默认配置，模态桥接与对齐的中间层产品将面临生存危机。更深远的影响在于商业模式：当前按token收费的体系依赖于自回归模型透明的成本结构，而连续空间中的扩散模型可能通过固定步数生成任意长度文本，使“token消耗”与算力成本脱钩，迫使行业重新定义AI的价值衡量标准。

尽管连续空间范式展现出突破token天花板的潜力，但其训练数据仍源于人类生成的有损压缩内容，这成为通向AGI的另一重限制。若模型摆脱语言压缩的束缚，新的训练信号从何而来？答案或许指向主动探索——让AI在世界中行动、承受后果、从反馈中学习，即递归自我改进（RSI）。这一命题，将成为下一阶段技术竞争的核心焦点。

更多>同类资讯

特斯拉HW3老车主迎曙光：FSD V14 Lite推送，中国车型升级待定

07-02

97年大模型技术专家孙天祥履新百度，引领基础模型研发新征程

07-02

爆款短剧《好一个乖乖女》立项电影，短剧IP能否在院线闯出一片天？

07-02

小米中国区人事变动：王晓雁卸任销售运营一部要职，陈幕楠张健等履新

07-02

小米首款智能存储设备众筹开启：原厂硬盘配置性价比高且操作便捷

若8TB与16TB版本同样搭载对应容量的原厂西数红盘，其硬盘单独采购成本亦将超过整机众筹售价。日常使用场景覆盖广泛：手机照片与各类文件支持一键备份；系统能自动识别人脸及行程信息，实现智能归类；影视资源入…

07-02

低预算迷你剃须刀怎么选？四款热门机型实测，助你找到适配之选

想要在有限预算内选到适配自身需求的便携剃须刀，需要结合机身材质、动力结构、续航收纳等维度逐一对比。结合日常通勤、差旅、居家备用等不同使用场景，本次选取四款受众广泛的迷你便携剃须刀，逐一拆解外观用料、动力配置…

07-02

充电宝怎么选？认准3C认证与实标容量，mikibobo凭高品质成高端市场优选

目前市面上mikibobo、小米、华为等这几个品牌的充电宝在质量和性价比上表现比较突出，是很多人选购时的首选。这些品牌不仅通过了国家强制的3C 认证，而且在快充技术、安全保护和售后服务上都有比较成熟的体系…

07-02

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

被骂得这么惨真是不多见。

07-02

科技赋能出行新选择，小米克系列智能平衡车，带你畅享多元骑行乐趣

更令人惊喜的是，小米克系列平衡车不仅适用于儿童和青少年，同样也适合成年人使用。高承重设计和多种骑行模式的结合，让成年人在体验骑行乐趣的同时，也能享受到智能科技带来的便捷与安全。让小米克系列智能平衡车陪伴你和家…

07-02

6月新势力销量揭晓：零跑破9万领跑鸿蒙理想小米各展风采

三款车型覆盖20万级走量市场、30万级轿跑市场、40万+旗舰市场，鸿蒙智行的产品矩阵已形成“金字塔”结构——问界M6托底走量，尚界Z7拓展新客群，问界M9拉升品牌高度。头部新势力品牌在6月交出了一份亮眼的成绩…

07-02

2026车载K歌新选择：漫步者索尼BOSE等品牌麦克风功能大比拼

索尼车载蓝牙KTV麦克风以其专业级音频调校技术和强劲的降噪功能受到不少用户青睐。JBL在音频输出方面表现均衡，能够适应各种车载环境，但在连接稳定性和FM功能上与漫步者相比还有一定差距。对于追求稳定蓝牙连接和车…

07-02

中国L3自动驾驶新规落地：安全底线划定，商业化黎明前的“紧箍咒”

车辆在高速或城市快速路（ODD场景）正常执行从A点到B点的驾驶任务时可以开启L3，车辆必须同时配备两类独立监控测冗余，至少在≤30秒内核验一次驾驶员是否具备接管能力，一旦系统不能继续完成驾驶任务（DDT），启…

07-02

数字阅读新博弈：Libby拟设AI过滤器，于浪潮中寻技术平衡支点

07-02

小米中国区人事变动：王晓雁卸任销售运营一部要职陈幕楠张健等新任上阵

07-02

SpaceX IPO备案引关注小行星采矿或从科幻走向现实新征程

07-02

点击查看更多 +

全站最新

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

科技赋能出行新选择，小米克系列智能平衡车，带你畅享多元骑行乐趣

6月新势力销量揭晓：零跑破9万领跑鸿蒙理想小米各展风采

中国L3自动驾驶新规落地：安全底线划定，商业化黎明前的“紧箍咒”

邬贺铨：智能体融入工业互联网，发展脉络、机遇挑战与应对全解析

半程销量领跑，上汽自主新能源海外三线并进开启新篇章

热门内容

本栏最新

MG07设计风波背后：品牌话语权之困与车圈舆论生态的双重审视

科技赋能出行新选择，小米克系列智能平衡车，带你畅享多元骑行乐趣

6月新势力销量揭晓：零跑破9万领跑鸿蒙理想小米各展风采

中国L3自动驾驶新规落地：安全底线划定，商业化黎明前的“紧箍咒”

2026上海电科臻和：第一季度快乐会议精彩纷呈共赴下一季拼搏之约

石头科技6月30日股价上扬1.52% 主力资金净流入超千万回购分红同步推进

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.