中国信息通信研究院近日宣布,将针对互联网智能体领域启动一项全新的测试评估工作。此次评估聚焦用户普遍关注的核心问题,包括功能可信度、权限可靠性、操作透明度以及行为可干预性等,旨在通过科学严谨的测试体系,推动行业健康发展。
据了解,该测试体系构建了三大类评估框架,涵盖16项核心指标和70余个细分测试项。评估维度包括能力真实性验证、权限管理可靠性审查以及行为控制有效性评估,通过多层次、多维度的测试方法,全面评估互联网智能体的技术成熟度和安全合规性。测试将根据不同服务形态进行分类实施,确保评估结果的专业性和针对性。
首批测试评估工作已正式启动,评估对象按两类形态三种类型进行划分。根据工作安排,2026年3月至4月将依次开展申报材料审核、技术指标测试和专家评审等环节。最终评估结果计划于2026年5月举行的产业大会上向社会公布,为行业提供权威的技术参考和标准指引。











