您的位置:首页>>业界动态

Blizzard Challenge 2019国际语音合成大赛,灵伴斩获亚军

发布时间:2019-08-05 14:10:42  来源:互联网    背景:

  在刚刚落幕的“Blizzard Challenge 2019”国际语音合成大赛中,灵伴科技的语音合成系统荣获综合评测指标第二的优异成绩。这是继灵伴在“Blizzard Challenge 2013”比赛中获得综合评测指标排名第一后,时隔6年第二次参赛,再次斩获殊荣。

  史上最难“中文合成”挑战

  “Blizzard Challenge”国际语音合成大赛由美国卡耐基-梅隆大学和日本名古屋工业大学联合发起,是语音合成领域最具权威性的国际技术评测比赛。它旨在构建一个公开、统一的语音合成技术评测平台,加强研究机构之间的技术交流与沟通,推动语音技术快速发展。

  与往届比赛相比,本届大赛的难度再创新高。大赛要求各参赛方利用大约8小时的罗振宇脱口秀声音素材,合成出自然、易懂,并和罗振宇本人的特点尽量相似的语音。

  更为重要的是,主办方对声音样本的来源进行了严格的约束:罗振宇本人的声音素材只允许使用主办方提供的8小时录音,禁止使用从其他渠道收集的数据;罗振宇以外的说话人声音素材可以随意使用。

  因此,本届参赛方主要面对两个挑战:如何用好罗振宇本人的为数不多的8小时录音;如何利用其它说话人的语音来帮助算法更好地学习罗振宇本人的讲话特点。

  超稳健合成系统,语音“可懂度”最佳

  在任务难度高、竞争对手实力强的情况下,灵伴提交的合成系统在自然度、相似度、可懂度三项评测指标中均表现优秀,获得了关键指标自然度第4名、相似度第2名、合成语音可懂度第2名、综合排名第2名的优异成绩。

  自然度和相似度分别表示合成声音的自然程度以及与罗振宇本人的相似程度,分数越高表示合成的语音越自然、和罗振宇本人的相似程度越高。从分数角度来看,在自然度和相似度上灵伴分别获得了4分和3.9分,共计7.9分,以微弱的差距落后于M。

  从排名角度来看,灵伴在自然度、相似度和可懂度方面分别排在第4、第2以及第2名。

  在同时考虑自然度和相似度的情况下,灵伴的排名为并列第2名。

  在同时考虑自然度、相似度以及可懂度的情况下,灵伴的排名为第2名。

  值得一提的是,灵伴的可懂度分数在相似度和自然度前十的队伍中排名最高,这意味着灵伴的语音合成最能够被“听懂”。

  人工智能技术落地的道路,往往是对系统能力的全方位考核。从语音合成需求的角度来看,自然度、相似度和可懂度都是实际应用场景中的关键指标:其中相似度是语音合成模型定制业务中主要考察的对象;而可懂度在人机交互过程中,直接决定了客户能否轻松而准确地理解机器人所表述的内容。

  因此,灵伴在本次比赛中的技术选型主要考虑真实落地场景,选择了相对稳健的“不偏科”的解决方案。比赛的结果也充分体现了灵伴合成技术的全面优势。

自然度、相似度、可懂度三项指标累加排名(越低越好)

  “路漫漫其修远兮,吾将上下而求索”,此次比赛的成绩对灵伴人来说,既是荣誉,亦是鞭策。语音交互的探索之途,灵伴人和世界上同道科研工作者们还有很长的路要走。灵伴人将继续脚踏实地,开拓创新,实现技术与产品的双重提升,开创人类与智能机器人共同发展的美好未来。

   Blizzard Challenge2013精彩回顾

  2013年是灵伴这支新锐团队首次参赛,在时间紧、任务重、对手强的多重困难下,团队一举战胜诸多国际顶尖科研机构,在自然度、相似度两个评测领域以绝对优势获胜,斩获当年Blizzard Challenge国际语音合成大赛综合评测第一名的桂冠,这也是主办方公认的语音合成领域第三次里程碑式技术突破。

  在自然度方面,灵伴(队伍代码为M)得分3.9分,超出第二名0.6分。

自然度得分情况(灵伴队伍代码为M)

  查看官方评测结果论文:http://festvox.org/blizzard/bc2013/summary_Blizzard2013.pdf

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:互联网

本文评论
被小米、vivo接连超越 三星手机印度销量锐减:出货量跌至第三
在13亿人口大国印度,三星同样被国产手机“围追堵截”,难以抵挡。
日期:04-27
MIUI高清复刻过去10年经典主题:全部免费
在今天下午举办的小米10青春版及MIUI 12发布会上,MIUI负责人小凡宣布,将过去10年的经典主题高清复...
日期:04-27
补齐短板!安卓最新版微信新功能盘点
前段时间,iOS系统已经开始推送测试版的新版微信了,但是安卓却迟迟没有动静。
日期:04-27
疫情后旅游业停摆,他在抖音直播带网友赏普陀山,每场数千人“围观”
​往年的大年初一,是代帅一年中最忙碌的时刻之一。作为一名普陀山的地接导游,从大年初一开始,普...
日期:04-27
米动手表青春版1S即将发布,华米CEO黄汪微博解读新品PAI指数功能
4 月 27 日,知名智能可穿戴公司华米科技官微发布华米 Amazfit 米动手表青春版 1S 新品预热海报,公...
日期:04-27
专利申请量指数级增长 解密平安专利养成史
“平安现在的创新和其他公司不一样,大部分公司都是创新一个点,平安的创新是一个立体型的、整体...
日期:04-27
看门神器:萤石智能可视门铃套装DB2C 手机即可看门外
如果你想更好地关注家门口的安全状况,却不具备安装智能猫眼的条件,那么可视智能门铃会是一个好选...
日期:04-27
重罚!淘宝天猫总裁蒋凡遭除名阿里合伙人:系最年轻一位
据国内媒体报道,今天,阿里公布了淘宝天猫总裁蒋凡事件的调查处理结果。
日期:04-27
环信荣获“2020艾瑞企业服务奖”,视频客服+AI初露锋芒
近几年,企业服务受到创业者和投资人的广泛关注,服务形式日趋多样,服务规模不断壮大。未来的企业...
日期:04-27
更加精进,更显出挑 联想YOGA 14s全新上市
依托去年笔记本市场中的高调表现,YOGA 14s一经曝光便引发了广大用户的关注。在联想中国区消费笔记...
日期:04-27
长鑫存储从美国Rambus获得大量内存技术专利
4月27日消息 根据长鑫存储微信公众号的消息,日前,长鑫存储技术有限公司与美国半导体公司Rambus In...
日期:04-27
小米十年梦想之作!MIUI 12正式亮相 雷军:惊艳
今天下午,小米10青春版5G新品& MIUI 12发布会在线上举办。发布会一开始,雷军登台,率先回顾了...
日期:04-27
SMR NAS硬盘被网友“毒打” 这个坑到底有多大?
HDD机械硬盘市场上目前只剩下希捷、西数、东芝三大厂商了,比稀有动物还少。最近闹出了一场风波&mda...
日期:04-27
富士施乐智能会议方案 助企业召开13城数百人云视频大会
又到了一年一度各企业召开新财年启动大会、代理商大会的高峰期。然而,今年的疫情却让人们不能像往...
日期:04-27
Win10 2020首个正式版即将推送:磁盘占用率高的顽疾终于被修复
今年Windows 10的第一个稳定版本(Build 19041.xxx)、也就是v2004(2020年五月更新)即将在月底或者下...
日期:04-27
三代锐龙CPU I/O裸片彩色透视图公布:“五脏六腑”毕现
基于7nm Zen2架构的AMD产品家族的布局接近圆满,它们在市场上也取得不俗反响。
日期:04-27
新浪AI媒体研究院联合中国传媒大学发布《中国智能媒体发展报告》
近日,中国传媒大学新媒体研究院联合新浪AI媒体研究院发布《中国智能媒体发展报告(2019-2020)》(以...
日期:04-27
在电竞场绽放青春:西部数据高校开黑挑战赛上海站顺利举办
目前电子竞技已经成为了大学生们平时最主要的娱乐活动之一,而LPL勇夺《英雄联盟》世界赛两连冠更是...
日期:04-27
人工智能加速变革客服行业,疫情加速这一过程
新型冠状病毒疫情不仅给全球带来健康危机,可能还加速了一个传统行业的变革:电话客服。
日期:04-27
涂鸦智能、艾拉物联两家开发者平台对比,设计公司和终端厂商应该选择谁?
近几年,在智能产品市场上,涂鸦智能以一站式免开发为卖点,切入智能家居领域,以产品开发快、开发...
日期:04-27
  专栏介绍
王涵 的专栏
王涵发表的文章
积分:
自我介绍 :