非Transformer架构AI新秀RockAI，WAIC展示大模型自主学习新突破

时间：2025-07-26 22:21:19 来源：智东西编辑：快讯团队 IP：北京 发表评论无障碍通道

在世界人工智能大会的热闹氛围中，一家上海的AI创业公司RockAI吸引了众多目光。这家企业正以一股不可忽视的力量，向中国乃至全球的AI主流Transformer架构发起挑战。

展会上，一台机器狗的表演尤为引人注目。它仅仅观察了观众用右手打招呼的手势，不到30秒的时间，便完美复刻了这一动作。令人惊讶的是，这一整个过程是在完全离线的情况下完成的，无需云端支持。这正是RockAI展台所展示的技术成果。

RockAI在2024年初推出了基于非Transformer架构的Yan 1.0大模型，随后又发布了Yan 1.3群体智能单元大模型，支持多模态理解，并成功在树莓派等低端硬件上实现部署。而今，最新的Yan 2.0 Preview模型更是引入了记忆和自主学习能力，使得机器狗等终端设备能够具备更为智能的交互能力。

Yan 2.0 Preview模型尽管只有3B参数规模，但在多个评测榜单上的表现已经超越了参数规模更大的Llama 3、Qwen 3和Gemma 3等模型。RockAI的CEO刘凡平表示，Yan架构打破了传统大模型的学习模式，不再依赖先预训练再微调的方式，而是在物理世界中直接学习和交互。

在WAIC展会上，基于Yan 2.0 Preview的灵巧手展示了自主玩推箱子游戏的能力。它会根据具体情况分析、评估，最终将箱子放置到正确位置。这一表现充分展示了Yan架构在多模态理解和端到端生成能力上的优势。

Yan架构的核心创新在于其引入了可微的记忆模块，实现了信息的存储、检索和遗忘。这一设计使得模型具备了原生记忆能力，能够在长期交互中实现知识更新和个性化演进。这对于迈向通用人工智能具有重要意义，因为它不仅能让模型记住用户信息、偏好，还能在持续交互中不断优化和提升。

RockAI的CTO杨华认为，赋予模型自主学习能力可能是未来的技术壁垒，也是探索AGI（通用人工智能）的重要阶段。当前，行业主流的大模型虽然在对话中表现出色，但缺乏真正的原生记忆能力，通常依赖外挂机制如RAG、长上下文窗口或外部数据库来模拟记忆。然而，这种方式无法实现类似人类的连续性和长期记忆。

RockAI的使命是“让世界上每一台设备拥有自己的智能”，这一愿景在Yan系列模型的发布和落地中得到了体现。Yan 2.0 Preview的离线部署能力使得终端设备具备了智能，机器狗能够在现场精准学习并复刻动作，记住每位观众的偏好和互动风格。这一技术的突破，让智能重新定义了硬件，硬件的使用周期从一次性交付变为了拥有长期记忆，能够随用户一起成长。

RockAI自2023年6月成立以来，就坚定地走上了非Transformer架构的道路。面对诸多行业质疑和技术难点，他们不断突破，最终在端侧模型部署上取得了显著成果。Yan系列模型已经成功落地在某品牌PC上，实现了集成大模型能力的会议助手等多项功能。

RockAI的未来愿景是构建“群体智能”，即一个由多个模型和终端组成的“机器社会”，实现群策群力与高度协作。在这个体系中，每一个智能终端不仅具备环境感知能力，还能与物理世界实时交互、自主学习与进化，共同构成一个有机协同、持续成长的智能群体。

RockAI的探索不仅是一次技术范式的突破，更是对未来人机关系的深刻思考。他们相信，智能新时代即将到来，每一个设备都将能够思考、协作和成长。

在1985年时，我提出了一个非常小的模型，想把这两个理论结合在一起，去更好理解“人类是如何理解一个词的”，每一个词我都放了好几个不同的特征，然后把前一个词的特征记录下来，就能预测下一个词是什么、进而再预测再下…

模型基于复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新，同时引入多模态理解信息提升对文本指令和输入条件图像视频的感知能力，联合图文交织数据训练，实现既能生成高质量的图像视频，又能进…

“磐石·工具调度台”旨在降低科研工具的使用门槛，可自主规划及调用超过300个科学计算工具，实现工具的协同编排和便捷调用，可自动识别科研任务、智能编排并调度最优工具链，提升科研流程效率，支持用户灵活接入自有智…

在现场观察发现，不同领域的观众都对于大模型公司有着极强的好奇，而类似于阶跃星辰这样的公司展示出的有趣产品，也将帮助他们更好地理解AI和现实的关联。今年展会现场，B站带来了众多站内爆款的AI及机器人主…

作为香港本地领先的科技企业，GOODDEED深耕软件开发、技术解决方案提供及本地业务运营，其技术团队凭借深厚专业功底，将大数据与AI深度融入业务场景——从软件开发注重用户体验与技术创新，到解决方案提供“咨询…

人设与回复逻辑设置是核心，需包含角色规范和思考规范，角色规范明确智能体作为关键词排名助手的任务，思考规范涵盖关键词获取、搜索引擎选择、排名查询、结果展示等步骤，且每段结尾需引导用户点击线索转化并发送知识库获取…

首先是100%开源，当前市场上的开源Agent主要是SDK或者框架，用户还需做进一步开发，而京东云JoyAgent智能体，整体开源了智能体产品能力，包括前端、后端、框架、引擎和核心子智能体，开发者可以快速部署…

国内具身智能头部企业智元机器人自主研发的启元通用具身大模型摘得该奖项。截至目前，智元机器人构建了机器人“本体+AI”全栈技术，具备核心零部件自研及整机集成和制造能力，并自主训练具身基座大模型。这是具身智能企业…

哇哦-夸克AI眼镜标志着阿里在AI领域的又一次战略性下注，代表了其AI to C战略正从软件领域延伸至多形态硬件。作为阿里巴巴AI能力与生态协同的集大成者，哇哦-夸克AI眼镜将深度融合阿里及支付宝生态：具备…

两个团队分工明确，FAIR 将继续专注于可能在五到十年后才能应用的长期性、探索性 AI 研究；而 MSL则更加聚焦于产品和具体使命，其核心任务是构建与人类价值观对齐的人工超级智能（ASI, Artifici…

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.