近日,通用智能体领域迎来重要进展——MiniMax Agent正式推出桌面端两项突破性功能更新,标志着智能体在复杂任务执行和跨平台协作能力上迈入新阶段。此次升级聚焦"Pocket"与"Computer Use"两大核心功能,通过深度整合即时通讯工具与系统级操作能力,重新定义了人机协作的边界。
作为此次更新的核心亮点,"Pocket"功能(Beta版)实现了智能体与主流IM平台的无缝对接。用户可在飞书、微信、企业微信及Slack等通讯软件中直接唤醒智能体,通过自然语言指令触发任务执行。该功能突破了传统智能体需固定设备操作的限制,使任务处理具备移动化特性。例如,当用户身处地铁或会议现场时,仅需发送"查找上周的营销方案"指令,智能体即可在其办公电脑中完成文件定位、内容提取及结果回传的全流程操作,真正实现"口袋里的数字助手"定位。
另一项革命性功能"Computer Use"则赋予智能体完整的系统操作权限。通过模拟人类视觉识别与肢体操作,该功能可自主完成屏幕内容解析、鼠标键盘控制等复杂动作。在技术实现层面,研发团队突破了三项关键技术瓶颈:多模态感知融合技术使智能体能准确识别隐藏在深层菜单中的系统设置;跨应用流程编排引擎支持多软件协同操作;隐私保护机制确保所有操作均在用户授权范围内进行。这些技术突破使得智能体能够处理传统自动化工具难以触及的任务场景。
在实际应用场景中,该功能展现出强大的任务处理能力。在人力资源场景中,智能体可自动读取指定文件夹内的简历文件,通过自然语言处理技术提取关键信息,再调用飞书API生成结构化分析报告,最终将包含候选人评分与面试问题的文档链接回传至对话窗口。整个过程无需人工干预,处理效率较传统方式提升80%以上。在系统维护场景中,智能体能独立完成"设置每日定时备份"这类跨应用操作,包括打开系统设置、定位存储选项、配置定时任务参数等12个步骤,所有操作记录均可通过截图实时反馈给用户。
此次功能更新标志着智能体从单一任务执行向复杂工作流管理的进化。通过将自然语言交互、跨平台协作与系统级操作能力深度整合,MiniMax Agent正在重新构建人机协作的范式。随着更多企业级应用场景的解锁,这种新型智能体有望在知识管理、流程自动化等领域引发新一轮效率革命。











