您的位置:首页>>智能设备
搜索: 标题  

ISCSLP2016 思必驰俞凯解析深度学习领域的智能语音技术

发布时间:2016-10-22 19:10:36  来源:互联网   编辑:即时新闻  背景:

  ISCSLP中文口语语言处理会议由国际著名学术协会ISCA的中文学术小组SIG-CSLP主办,为全球针对中文语言处理技术所举办的大型国际研讨会,并由新加坡、中国大陆、台湾及香港等四个国家和地区轮流举办,该会议已经发展成为中文语言处理技术相关领域最重要的国际研讨会。

图1 ISCSLP2016大会现场

  2016年10月17日至20日,第十届中文口语语言处理国际会议ISCSLP2016 在天津召开,会议聚集了来自全球各地学界和产业界的人士,并向全球征集业界前沿学术论文稿件,展示前沿科技成果,结合当前产业发展态势,共同探讨语言处理的未来发展趋势。

图2 思必驰首席科学家俞凯现场

  10月18日下午,思必驰首席科学家/联合创始人、上海交通大学俞凯教授,在大会新技术产业论坛上,进行了题为《基础技术创新推动产业进步》的主题分享。俞凯教授表示,智能语音在经历着从感知智能到认知智能的飞跃,解决如何使智能语音进行理解、决策及表述的问题非常重要。俞凯教授强调技术型公司原始创新的重要性,着重介绍了思必驰基于深度学习的语音识别技术,如,VDCNN算法在降噪处理上表现出不可取代的优势;帧同步解码转换为音素同步解码搜索空间减少80%以上等技术成果。依托稳健的研究实力,思必驰用实际行动践行着作为技术型公司应有的创新、原创精神。

  思必驰专注为智能硬件提供自然语言交互方案,为智能车载、智能家居、智能机器人三个垂直领域定制基于交互场景的语音方案。根据不同应用场景,思必驰依托强大的研发实力满足用户在不同场景下的个性化需求。虽然目前国内智能语音领域,通用的开源工具应用较多,难度较低,但通用的开源工具在效率和权限上有极大局限性,既无法满足特定的前沿算法需求,也常常无法满足用户基于场景的个性化需求,不同专业领域的算法、数据、架构等都要依托实际应用进行搭建及优化。因此,思必驰专注技术研发,用技术实力说话,通过定制方案满足用户个性化需求。

  如何确保技术的专业性与前沿性呢?思必驰成立之初即与上海交大成立联合实验室“Speech Lab”,由思必驰联合创始人,上海交通大学教授俞凯全权负责,专注智能语音技术的研发与应用,思必驰拥有独立知识产权,并积极促进前端科研成果的商业化转化与应用。正如俞凯教授在演讲中所提,近期,思必驰上海交大联合实验室的科研工作又取得了极大突破。

   1. 抗噪处理:VDCNN算法模型结构

  噪声环境下的语音识别一直以来是一个难题。目前基于深度学习的主流语音识别技术及引擎,已经可以在很多信噪比相对比较好的环境下取得良好的准确率,但是在面对真实环境下的多类别强噪声情况环境(比如车载噪声、家居远场回声等),性能变会急剧下降,远远不能满足实际应用的需求。

  思必驰和上海交大联合实验室,对基于噪声条件下的语音识别问题进行了深入的研究,历时一年多以来,提出了VDCNN算法模型结构。相比于传统语音模型仅使用1至2层卷积层,思必驰通过堆叠较小的卷积层和池化层,将语音模型中的卷积层的深度提高到了10层以上。利用小卷积核更加精细的局部刻画能力和频率不变性描述,能够更好地在语音模型的内部实现了声学自动降噪的能力。

  思必驰上海交大联合实验室目前所提出的模型和架构,在噪声环境语音识别的业界基准库Aurora4上,取得了7.09%的词错误率。相比于世界其他机构目前10%左右的最好结果,有一个大幅度的明显优势,在抗噪语音识别上是一个新的里程碑。此外,除了多类别的加性噪声,此模型也被验证在远场识别环境下也具有明显的优势。近5年,在Aurora4噪声数据库上,公开可查的世界上著名研究机构最好语音识别系统对比如下图所示:

图3 Aurura WER{%)

  思必驰上海交大联合实验室VDCNN算法模型结构,不但在噪声环境下具有非常好的准确率,还具有训练收敛速度快,模型参数规模小等优势,这些特点都为VDCNN的真实使用提供了便利。

   2. 新型解码框架:Phone Synchronous Decoding

  大词汇连续语音识别由于词汇量庞大且没有固定语法,会造成搜索空间非常庞大。目前,通过很多传统做法可以加快语音识别速度,如,离线基于WFST的搜索空间预优化,在线逐帧同步维特比解码,结合可变帧率分析等方法。但是,离线优化效果有限,逐帧搜索计算量大,而大量剪枝算法会引入搜索误差。因此目前主流的大词汇连续语音识别系统只能工作在云端。

  近来,连接时序模型(CTC)取代传统隐马尔科夫模型(HMM),被应用到语音识别中,其特点显著,能够针对识别序列进行整体建模,带来更好的前后文建模能力,使语音识别的建模单元显著减少,并使庞大搜索空间相应减小。另一方面,模型本身建模了多帧对一个音素的映射关系,使得模型输出的声学信息集中。根据模型输出特点,适宜采用更长的搜索步长,由逐帧同步解码,转变为音素同步解码,从而减少了搜索计算量。

  思必驰结合以上两点改进,使语音识别系统的速度累积提高20-30倍,内存下降50%以上,从而使得大词汇连续语音识别可以应用于离线手持设备;而基于该系统提出的置信度算法,得益于集中的声学信息和相应设计的优化算法,取得近一倍的提升。显著改善了语音识别系统的用户体验。

  近年来,思必驰凭借原始技术创新,在智能车载、智能家居、智能机器人等领域的语音市场展开了布局,与阿里、小米、联想、海尔、美的、庆科、浙江大华等企业建立了战略合作关系,为广大用户带来流畅的语音交互体验。基础技术创新必定会推动产业化进步,思必驰重视技术及人才价值,打造更人性化的语音交互。

  声明:本文仅为传递更多网络信息,不代表ITBear观点和意见,仅供参考了解,更不能作为投资使用依据。


返回网站首页 本文来源:互联网

本文评论
智能音箱会成为下一个风口吗?
近期智能音箱概念风起云涌,业界领头羊亚马逊的智能音箱产品ECHO销量轻松突破千万更是为此增添一把...
日期:07-14
爆料:诺基亚手机有Nokia 2、3、5、6、7、8、9八款
如果你一直关注诺基亚手机的相关新闻,那么你可能清楚地知道,Nokia 品牌的外包公司 HMD Global 目...
日期:07-14
功能缺失的iPhone 8变配角?全新7S系列有望登场
如今各个手机品牌都想推出自家全面屏设计的手机,但是在全面屏屏幕的供应商上,能够保证正常供应的...
日期:07-14
苹果以后会怎么定位iPad?专心打辅助?
对于苹果来说,iPad如今到底应该处于一个什么位置呢?从长远来看,或许平板电脑的销售依然可以成为推...
日期:07-14
取代指纹识别?苹果研究iPhone面部识别功能快10年了
根据之前的报道,苹果打算在即将发布的iPhone 8手机上配备的无线充电功能和前置3D摄像头都遇到了软...
日期:07-14
三星官方剧透Note8外观 发布时间再提前
或许是传出下月底即将发布的缘故,三星GALAXY Note8不仅在网络上频繁被曝光,而且现在官方也似乎加...
日期:07-14
iPhone 8或配备3D激光摄像头 应该是给AR准备的
苹果在今年的WWDC 2017上带来了ARKit,应该是铁了心要在AR(增强现实)领域动真格。而根据Fast Compan...
日期:07-14
iPhone 8砍掉Touch ID:耗时3年堆最强面部识别
对于iPhone 8,目前最新的传言是,苹果放弃了指纹识别。虽然郭明池仅仅表示,iPhone 8的正面Home和S...
日期:07-14
Facebook将在明年推低价版无线VR头盔 还有小米定制版
Facebook公司正在采取进一步措施,让其Oculus Rift虚拟现实(VR)头戴设备成为大众化产品。
日期:07-14
中国手机厂商加速“出海”:上半年手机出口增长13.5%
7月13日,海关发布的最新统计数据显示,2017年上半年,我国货物贸易进出口总值13.14万亿元人民币,...
日期:07-14
华为全面屏Mate 10浮现:更大更震撼
虽然不少厂商都在拼屏,但是摄像头依然是手机更新换代的重中之重,事实也确实如此,特别是火热双摄...
日期:07-14
诺基亚Edge概念图亮相 全视曲面屏加持
诺基亚回归已经有一段时间,然而到目前为止依然只推出了诺基亚6等非旗舰产品。对于许多消费者而言,...
日期:07-14
无边框OLED又怎样?苹果iPhone 8吸引力不大
关于苹果今年的全新旗舰新机iPhone 8的爆料已经足够多了。基本上可以说,我们已经不用等到九月份就...
日期:07-14
员工泄露坚果 Pro 最真实销量,这些销量能养活锤子到下款新机发布吗?
  心疼罗永浩一秒。 还有什么比被自家员工坑更悲惨的事情呢?尤其是当你公司的新机本来发布之...
日期:07-13
三星S8/S8+珊瑚蓝版配色最早明日登陆北美市场
上个月据Evan Blass爆料称,三星上半年发布的旗舰机型S8/S8+的珊瑚蓝(Blue Coral)配色即将在7月登陆...
日期:07-13
苹果为新iPhone增加后置3D激光系统 提高AR精度
苹果公司的工程师正在努力工作,为今秋发布的一款新iPhone增加后置3D激光系统。
日期:07-13
前期售价2万元 iPhone 8开卖时间曝光 延后1个月
想要买iPhone 8的用户要提前做好准备了,这款手机发售时间已经延后,并且前期供应量出奇的少。
日期:07-13
从线上“突围”线下,互联网手机再次崛起了
  后浪推前浪,前浪倒在沙滩上。 从各方最新的国内手机线下销售报告来看,部分互联网品牌已...
日期:07-13
中低端齐上阵 诺基亚又要玩机海战术
虽然诺基亚9何时发布尚未有确切的消息,但现在网络上却已经开始流传诺基亚还有三款新机即将登场的消...
日期:07-13
三星S8销售放缓导致Note8或提前上市
三星的Galaxy S8组合取得了非常不错的反响,这种采用颠覆性外观设计的风格,受到了大部分消费者的好...
日期:07-13