您的位置:首页>>业界动态

Blizzard Challenge 2019国际语音合成大赛,灵伴斩获亚军

发布时间:2019-08-05 14:10:42  来源:互联网    背景:

  在刚刚落幕的“Blizzard Challenge 2019”国际语音合成大赛中,灵伴科技的语音合成系统荣获综合评测指标第二的优异成绩。这是继灵伴在“Blizzard Challenge 2013”比赛中获得综合评测指标排名第一后,时隔6年第二次参赛,再次斩获殊荣。

  史上最难“中文合成”挑战

  “Blizzard Challenge”国际语音合成大赛由美国卡耐基-梅隆大学和日本名古屋工业大学联合发起,是语音合成领域最具权威性的国际技术评测比赛。它旨在构建一个公开、统一的语音合成技术评测平台,加强研究机构之间的技术交流与沟通,推动语音技术快速发展。

  与往届比赛相比,本届大赛的难度再创新高。大赛要求各参赛方利用大约8小时的罗振宇脱口秀声音素材,合成出自然、易懂,并和罗振宇本人的特点尽量相似的语音。

  更为重要的是,主办方对声音样本的来源进行了严格的约束:罗振宇本人的声音素材只允许使用主办方提供的8小时录音,禁止使用从其他渠道收集的数据;罗振宇以外的说话人声音素材可以随意使用。

  因此,本届参赛方主要面对两个挑战:如何用好罗振宇本人的为数不多的8小时录音;如何利用其它说话人的语音来帮助算法更好地学习罗振宇本人的讲话特点。

  超稳健合成系统,语音“可懂度”最佳

  在任务难度高、竞争对手实力强的情况下,灵伴提交的合成系统在自然度、相似度、可懂度三项评测指标中均表现优秀,获得了关键指标自然度第4名、相似度第2名、合成语音可懂度第2名、综合排名第2名的优异成绩。

  自然度和相似度分别表示合成声音的自然程度以及与罗振宇本人的相似程度,分数越高表示合成的语音越自然、和罗振宇本人的相似程度越高。从分数角度来看,在自然度和相似度上灵伴分别获得了4分和3.9分,共计7.9分,以微弱的差距落后于M。

  从排名角度来看,灵伴在自然度、相似度和可懂度方面分别排在第4、第2以及第2名。

  在同时考虑自然度和相似度的情况下,灵伴的排名为并列第2名。

  在同时考虑自然度、相似度以及可懂度的情况下,灵伴的排名为第2名。

  值得一提的是,灵伴的可懂度分数在相似度和自然度前十的队伍中排名最高,这意味着灵伴的语音合成最能够被“听懂”。

  人工智能技术落地的道路,往往是对系统能力的全方位考核。从语音合成需求的角度来看,自然度、相似度和可懂度都是实际应用场景中的关键指标:其中相似度是语音合成模型定制业务中主要考察的对象;而可懂度在人机交互过程中,直接决定了客户能否轻松而准确地理解机器人所表述的内容。

  因此,灵伴在本次比赛中的技术选型主要考虑真实落地场景,选择了相对稳健的“不偏科”的解决方案。比赛的结果也充分体现了灵伴合成技术的全面优势。

自然度、相似度、可懂度三项指标累加排名(越低越好)

  “路漫漫其修远兮,吾将上下而求索”,此次比赛的成绩对灵伴人来说,既是荣誉,亦是鞭策。语音交互的探索之途,灵伴人和世界上同道科研工作者们还有很长的路要走。灵伴人将继续脚踏实地,开拓创新,实现技术与产品的双重提升,开创人类与智能机器人共同发展的美好未来。

   Blizzard Challenge2013精彩回顾

  2013年是灵伴这支新锐团队首次参赛,在时间紧、任务重、对手强的多重困难下,团队一举战胜诸多国际顶尖科研机构,在自然度、相似度两个评测领域以绝对优势获胜,斩获当年Blizzard Challenge国际语音合成大赛综合评测第一名的桂冠,这也是主办方公认的语音合成领域第三次里程碑式技术突破。

  在自然度方面,灵伴(队伍代码为M)得分3.9分,超出第二名0.6分。

自然度得分情况(灵伴队伍代码为M)

  查看官方评测结果论文:http://festvox.org/blizzard/bc2013/summary_Blizzard2013.pdf

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:互联网

本文评论
头号玩咖参展2019世界VR产业大会 国务院副总理刘鹤莅临指导
2019年10月19日-21日, 2019世界VR产业大会在江西南昌举行。在同期举办的2019 VR/AR产品和应用展览...
日期:10-19
世界VR产业大会开幕 玖的揽获「中国VR50强企业」「VR/AR年度创新奖」两大奖项
10月19日,以“VR让世界更精彩——VR+5G开启感知新时代”为主题的第二届世界VR...
日期:10-19
开发者服务起风了:2019极光开发者大会,聚焦开发价值!
2019年10月19日,“2019极光开发者大会”在深圳召开,数千位互联网公司技术领袖、合作伙...
日期:10-19
华为:希望把VR/AR打造成下个智能手机产业
10月19日消息,2019世界VR产业大会在江西省南昌市举行。华为轮值董事长郭平发表了《打造VR/AR信息高...
日期:10-19
华为云受邀参加2019IDC中国数字化转型年度盛典,“5G+云+AI”助力企业数字转型
2019年10月18日,由IDC中国主办的“2019 IDC数字化转型年度盛典暨第四届中国数字化转型领军用...
日期:10-19
语音识别大拿Daniel Povey正式加入小米,将组团队开发下一代Kaldi
10月19日消息 据小米集团副总裁、小米技术委员会主席@崔宝秋-小米 消息,语音识别大拿Daniel Povey...
日期:10-19
蚂蚁金服共享智能平台打破数据孤岛,荣获“2019CCF 科技进步优秀奖”
10月18日,在2019中国计算机大会上,“蚂蚁金服隐私保护共享智能平台”荣获“CCF科...
日期:10-19
我国研发5款自主产权3D显卡:支持国产处理器及操作系统
   继国产处理器获得突破之后,国产GPU/显卡也取得了重大进展。
日期:10-19
华为开发者大会2020将于明年2月11日在深圳召开
10月19日消息 今日上午,据华为中国官方消息,华为开发者大会2020将于2020年2月11日-12日在深圳召开...
日期:10-19
Digitimes:英特尔将在2020年中发布Xe独显,采用10nm工艺
10月19日消息 根据TPU的报道,接近Digitimes的消息人士透露,英特尔将很快推出其首个10纳米独立显卡...
日期:10-19
AMD有望在11月5日发布新款线程撕裂者和TRX40芯片组
10月19日消息 根据VideoCardz的独家爆料,AMD计划发布三款Threadripper 3000处理器,分别是 3960X,...
日期:10-19
英特尔将于月底推出新款超低压处理器:10nm工艺,3D封装
10月19日消息 根据Notebookcheck的报道,英特尔将于2019年10月23日和24日在加州圣克拉拉的凯悦酒店...
日期:10-19
政企智能转型升级正当时 华为云打造西安智慧产业新高地
10月17日,由华为公司主办的“西安·选择不凡 华为云城市峰会2019”在西安如期举行...
日期:10-19
华为云依托5G+云+AI技术 加速政企转型升级
10月17日,“西安·选择不凡 华为云城市峰会2019”如期在西安举行。西安市市长李明...
日期:10-19
西安航天基地华为云人工智能创新中心正式发布
10月17日,西安·选择不凡 华为云城市峰会2019在西安举行,针对Cloud 2.0时代下的政企上云需...
日期:10-19
人才培养正当时,华为云联合7大高校发布西北鲲鹏人才培养计划
  10月17日,西安·选择不凡 华为云城市峰会2019在西安拉开帷幕,着眼西北地区科技创新发展,华...
日期:10-19
爱奇艺创新CDN系统奇速播荣获中国计算机学会 “CCF科学技术奖科技进步杰出奖”
10月17日-19日,由中国计算机学会(CCF)创办的2019中国计算机大会在苏州举办,爱奇艺融合边缘云的新...
日期:10-19
世界互联网大会开幕,UCloud优刻得展示企业上云新科技
10月18日上午,第六届世界互联网大会“互联网之光”博览会在浙江乌镇拉开帷幕。国家互联...
日期:10-19
Breeno语音“万物互融”丰富覆盖渠道,为开发者提供更多品牌精准客群
10月15日「OnePlus 7T 系列新品发布会」在北京举办。此次发布会除了发布了硬件端旗舰级一加手机,也...
日期:10-18
哈弗H6斩获第76个月销冠,不断刷新SUV市场销量记录
进入2019年下半年后,中国汽车市场发生了微妙的变化,轿车相较2018年依旧呈现下跌态势,而SUV异军突起,...
日期:10-18
  专栏介绍
王涵 的专栏
王涵发表的文章
积分:
自我介绍 :