在人工智能技术加速渗透各领域的当下,AI智能体作为承载复杂任务的核心载体,其安全性问题正引发社会高度关注。9月16日国家网络安全宣传周期间,中国电信联合公安部第三研究所、华为、蚂蚁集团、清华大学、上海交通大学及《信息安全研究》杂志社等十余家单位,共同发布了行业首个《AI智能体安全治理》白皮书,为构建智能体安全生态提供系统性解决方案。
该白皮书深度剖析了AI智能体在环境感知、决策规划、学习记忆及任务执行等关键环节存在的安全隐患。研究团队通过梳理国际最新技术动态,系统归纳出智能体全生命周期中可能遭遇的12类风险场景,涵盖数据泄露、算法偏见、决策失控等核心问题。针对这些风险,白皮书创新性地提出"全层级-全周期"防护框架,明确划分技术防护、管理管控、法律规制三层防御体系,并制定涵盖数据加密、模型审计、应急响应等33项具体防控措施。
在实践层面,白皮书详细披露了中国电信与合作伙伴在金融、交通、医疗等领域的落地案例。例如在智能客服场景中,通过动态身份核验与行为轨迹分析技术,有效拦截了98.7%的异常操作请求;在自动驾驶领域,建立的"感知-决策-执行"三级验证机制,使系统容错率提升至99.99%。这些实践为行业提供了可复制的安全治理模板。
参与编制的专家指出,AI智能体安全治理需要技术、管理、法律三方面协同推进。清华大学团队提出的"可信增强学习"框架,通过在算法层嵌入安全约束模块,使智能体在复杂环境中仍能保持合规决策;上海交通大学研发的"动态风险评估引擎",可实时监测智能体行为偏离度,及时触发熔断机制。这些技术突破为构建安全可控的AI生态奠定基础。
随着智能体技术的快速发展,其安全治理已成为关乎数字社会稳定的关键命题。中国电信表示,将持续深化与产学研用各方的合作,推动建立智能体安全认证体系,完善从芯片层到应用层的全链条防护机制,为人工智能技术健康发展筑牢安全基石。