为适应人工智能技术快速发展对语言文字应用的新需求,国家语言文字工作委员会联合教育部正式推出两项关键性语言文字规范标准。此次发布的《机器合成普通话水平测评等级标准及测评大纲》与《人工智能语料库基础术语》,标志着我国语言文字标准化建设在数字化领域取得突破性进展。
新发布的《机器合成普通话水平测评等级标准及测评大纲》构建了完整的机器语音质量评价体系,涵盖发音准确度、语调自然度、语流连贯性等核心指标。该标准不仅为智能语音技术研发提供量化参考,更在智能客服、语音导航、有声读物等应用场景的质量评估中发挥关键作用。配套测评大纲则明确了从初级到高级的分级测试方法,为行业提供可操作的技术规范。
同步推出的《人工智能语料库基础术语》系统梳理了语料库建设领域的专业概念,对语料采集、标注规范、质量评估等环节的200余个术语进行权威定义。这份术语集既包含"语料清洗""多模态标注"等新兴技术概念,也规范了"语料平衡性""标注一致性"等核心评价指标,为人工智能训练数据的标准化处理奠定基础。
据相关负责人介绍,两项规范的研制历时三年,组织了来自高校、科研机构、企业的百余位专家参与论证。规范制定过程中充分吸纳了语音识别、自然语言处理等领域的最新技术成果,确保标准既具有前瞻性又具备实践指导价值。目前语文出版社已启动规范的出版发行工作,相关电子版本将在国家语言文字资源平台同步上线。
此次规范发布是落实国家语言文字信息化战略的重要实践,与《中华人民共和国国家通用语言文字法》中关于推进语言文字智能化建设的要求高度契合。专家指出,随着人工智能在语言处理领域的深入应用,建立统一的技术标准体系对于保障语言信息安全、促进技术健康发展具有重要意义。这两项规范的实施,将为构建安全可信的人工智能语言生态提供制度保障。











