ITBear旗下自媒体矩阵:

智谱发布GLM‑TTS语音合成系统:小样本高效训练,低成本高还原度

   时间:2025-12-11 15:23:41 来源:互联网编辑:快讯 IP:北京 发表评论无障碍通道
 

近日,人工智能领域迎来一项重要突破——智谱公司正式推出并开源了GLM‑TTS工业级语音合成系统。该系统凭借独特的技术优势,在语音合成领域展现出强大的竞争力,引发行业广泛关注。

GLM‑TTS系统的一大亮点在于其高效的学习能力。仅需3秒的语音样本,该系统就能精准捕捉说话人的音色特征与说话习惯。这一特性使其在多个应用场景中大放异彩,无论是通用朗读、情感配音,还是教育评测、电子书有声化以及有声客服等领域,都能实现自然流畅、高度贴近真人的语音输出效果,为用户带来沉浸式的听觉体验。

在训练数据方面,GLM‑TTS系统展现出了极高的效率。官方数据显示,该系统仅使用10万小时的训练数据,这一数据量远低于行业主流商用模型。尽管训练数据量较少,但GLM‑TTS在训练成本和效果之间实现了完美平衡。其预训练过程仅需单机运行4天,就能达到开源SOTA(当前最优技术)水平的“发音准确度”,同时具备超高“音色还原度”。针对精品音色的LORA和强化学习训练,也仅需单机1天即可完成,大大缩短了训练周期,降低了训练成本。

值得一提的是,GLM‑TTS系统在价格方面也具有显著优势。凭借其卓越的性能,该系统以更低的价格获得了行业领先的MOS(平均意见得分)分数,这一分数是衡量语音合成质量的重要指标。这意味着,用户可以在更低成本的前提下,享受到更高质量的语音合成服务,为语音合成技术的普及和应用奠定了坚实基础。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version