为加速智能体技术向纵深发展,推动其与实体经济形成深度协同效应,中国信息通信研究院近日宣布启动2026年度“可信AI-智能体”评估体系。该评估从技术底座与应用效能两大方向切入,通过标准化框架衡量智能体在不同场景下的综合表现,旨在为产业生态建设提供权威参考。
在基础技术维度,评估体系聚焦四大核心领域:平台工具的兼容性与扩展性、技术能力的算法鲁棒性与数据安全性、运营服务的全生命周期管理能力,以及工程能力的系统集成与交付水平。通过量化指标与场景化测试相结合的方式,全面评估智能体底层架构的成熟度。
应用能力评估则覆盖三大场景:通用任务场景重点考察智能体在自然语言处理、多模态交互等基础功能上的表现;行业应用场景针对金融、医疗、制造等领域的特定需求,评估其垂直解决方案的落地效果;成熟度评估则通过标准化分级体系,衡量智能体从研发到商业化的完整链路能力。
此次评估体系的推出,标志着我国智能体产业从技术探索阶段迈向标准化发展新阶段。通过构建“技术-应用”双轮驱动的评估框架,不仅能为产业链上下游企业提供清晰的发展路径,也将助力形成开放共赢的产业生态,推动智能体技术真正服务于实体经济转型升级。









