ITBear旗下自媒体矩阵:

小米研究员罗福莉新论文聚焦AI Agent:动作级调度破解算力浪费难题

   时间:2026-03-16 16:14:38 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

人工智能领域正经历一场从“模型中心”向“Agent系统”的范式转移。传统AI系统以单一模型为核心,通过输入数据、模型计算、输出结果的线性流程完成任务,其资源消耗集中于GPU算力。但随着AI Agent技术的突破,计算模式发生根本性变化——系统开始整合GPU、CPU、API接口、存储设备和网络资源,形成多维度资源协同的复杂架构。

以典型任务为例,现代AI Agent在执行“整理新闻并生成报表”任务时,需依次完成网页搜索、信息抓取、内容总结、表格生成和文件保存等操作。这一过程涉及浏览器调用、Python脚本执行、文件系统交互和模型推理等多重技术栈。类似的技术路径已体现在OpenClaw框架和Anthropic更新的Claude Code系统中,后者通过新增的/loop循环指令、CLAUDE.md长期记忆模块和Session Spawning远程任务启动功能,使AI具备持续运行的数字员工属性。

资源调度难题随之浮现。传统任务级调度机制在Agent场景下暴露出严重缺陷:当系统执行编程任务时,CPU利用率常低于50%,大量算力处于闲置状态。这种资源浪费在规模化训练中直接转化为高昂成本,成为制约技术落地的关键瓶颈。针对该问题,小米AI实验室团队提出动作级资源调度方案,其核心逻辑是将资源分配单位从“任务”细化为“操作”。

新系统Tangram通过动态解耦技术,实现资源与具体操作的精准匹配。当Agent执行代码编写时调用GPU,编译阶段切换至CPU,资料搜索时启用API接口,形成资源池的实时共享机制。实验数据显示,该方案使任务平均完成时间缩短至原先的1/4.3,训练效率提升1.5倍,外部资源成本降低71%。这种突破性进展为大规模Agent训练提供了可行路径。

技术演进脉络显示,当前AI竞争已形成分层架构:OpenClaw构建基础运行框架,Claude Code和Devin探索真实场景应用,而Tangram类研究则着力解决底层计算效率。这种转变标志着行业重心从模型参数竞赛转向系统能力建设,资源调度、任务分解和工具链整合等工程化能力正成为新的竞争焦点。随着技术栈的垂直整合,AI系统开始展现出类似完整软件生态的复杂性特征。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version