ITBear旗下自媒体矩阵:

美的AIRC研究院推出SemaClaw框架:为AI智能体打造可靠"驾驭装置"

   时间:2026-04-27 01:33:25 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能助手正从实验室走向日常生活,但其可靠性仍受制于底层基础设施的完善程度。美的人工智能研究中心(Midea AIRC)最新发布的开源框架SemaClaw,通过系统性工程创新,为智能体领域提供了可复用的"驾驭装置"解决方案。该研究以预印本形式登陆arXiv平台,编号2604.11548,开源代码同步公开于GitHub社区。

传统AI开发聚焦于模型能力优化,但现实场景中的复杂需求暴露出三大系统级挑战:任务编排缺乏灵活性、行为安全难以保障、长期记忆机制缺失。研究团队以OpenClaw系统的大规模部署为例,指出当智能体接入用户邮件、日历等核心系统后,现有架构在处理多步骤依赖任务时,要么因流程固化无法应对意外情况,要么因决策过程不透明导致用户无法追溯问题根源。

针对这些痛点,SemaClaw采用双层架构设计。底层`sema-code-core`作为智能体运行时引擎,独立管理执行循环、工具调度和上下文生命周期,确保不同应用场景下基础能力的复用性。上层`semaclaw`则构建应用生态,集成通讯平台接入、多智能体协调和记忆管理等模块。这种分离式设计使新增通讯渠道或改进记忆算法时,无需修改底层执行引擎,显著降低系统维护成本。

记忆管理是提升智能体可靠性的关键突破。SemaClaw创新性地构建三层上下文体系:工作记忆处理当前对话的临时信息,通过结构化摘要压缩历史数据,防止上下文窗口过载;外部记忆采用混合检索机制,结合向量搜索与关键词匹配,确保跨语言查询的准确性;结构化上下文注入则通过区分"灵魂目录"与"工作区目录",使智能体在切换任务时保持身份连续性。这种设计使系统既能记住用户偏好,又能避免无关信息干扰当前推理。

在行为安全领域,权限桥(PermissionBridge)机制将人工授权嵌入执行流程。当智能体需要调用外部API或修改文件时,系统会自动暂停并生成包含工具名称、参数和预期操作的审批消息。用户响应通过唯一请求ID精准路由,确保多智能体并发操作时的请求隔离。研究团队特别强调,内置工具默认预授权,而用户安装的外部工具必须逐次获得明确许可,这种分级设计有效平衡了便利性与安全性。

多智能体协调方面,DAG团队方法突破传统工作流图的静态限制。编排者语言模型首先动态生成任务依赖图,明确各节点间的执行顺序和条件关系;随后确定性调度器接管控制权,按照预设图谱推进任务,即使部分节点失败也不影响整体流程。这种"动态规划+确定性执行"的混合模式,使系统既能处理突发子任务,又保持图结构的可观测性。

针对不同复杂度的定时任务,SemaClaw提供四种执行模式:纯通知模式直接发送预设消息,零算力消耗;纯脚本模式执行确定性代码,适合数据采集等场景;纯智能体模式启动完整推理流程,处理需要判断的任务;混合模式则先运行脚本预处理数据,再交由智能体分析结果。这种分级设计使资源分配与任务需求精准匹配,避免语言模型过度使用导致的成本激增。

个人知识库的构建标志着智能体从"工具"向"伙伴"的进化。区别于传统对话记忆的时效性限制,SemaClaw采用Markdown文件目录树存储结构化知识,支持用户直接编辑和重组内容。智能体通过命令行接口与知识库交互,在任务执行过程中自动分类保存洞见,同时为用户提供Web界面进行可视化管理。这种人机协同的编辑循环,使每次交互产生的知识都能沉淀为用户可复用的资产。

尽管SemaClaw在工程实现上取得突破,研究团队仍坦诚指出未解难题:持久身份智能体可能面临角色漂移问题,驾驭工程对模型能力的替代效应尚需验证,记忆数据的法律归属权缺乏明确框架,有状态插件的权限模型需要重构,社区生态的治理机制亟待建立。这些公开挑战为后续研究指明了方向,开源社区的协作或将加速解决方案的诞生。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version