滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

机器之心GMIS2017：人工智能语音技术的百家争鸣

时间：2017-05-31 18:06:07 来源：互联网编辑：星辉 发表评论无障碍通道

图1 机器之心GMIS大会现场

柯洁与Alphago的人机大战刚刚落下帷幕，计算机围棋顶级专家、阿尔伯塔大学Martin Müller教授出席了机器之心于5月27日-28日主办的2017全球智能机器峰会(GMIS2017)。出席大会的有众多来自美国、欧洲、加拿大及国内的顶级专家学者，兼顾学界与产业、科技巨头与创业公司，以专业化、全球化的视角带来了一场智能盛宴。

智能语音是GMIS2017全球智能机器峰会的一个重点论题，近些年来在深度学习的推动下，语音识别的准确度在一些评测标准上已经超过了人类水平。国际语音学术领域的顶级学者及业界领军人物悉数出席大会，如LSTM之父Jürgen Schmidhuber、腾讯AI Lab副主任俞栋、Citadel首席人工智能官邓力、加拿大麦吉尔大学语言学副教授&科幻电影《降临》的科学顾问 Jessica Coon、搜狗 CEO 王小川、科大讯飞执行总裁胡郁、思必驰首席科学家俞凯等，从技术研究及产业应用的角度，剖析人工智能语音技术的应用及发展。

腾讯AI Lab俞栋：语音识别领域的前沿研究

俞栋是腾讯AI Lab副主任，语音识别和深度学习领域的著名专家，此前任微软研究院首席研究员，兼任浙江大学兼职教授和中科大客座教授，IEEE语音语言处理专业委员会委员。现场，俞栋发表了《语音识别领域的前沿研究》主题演讲，探讨语音识别领域的4个前沿问题。

图2 腾讯AI Lab副主任俞栋

第一个前沿问题是如何构建更有效的序列到序列(Sequence-to-Sequence)直接转换的模型，目前最佳的解决方案是把 CTC 与 Attention 结合起来，CTC有持续信息，可根据后面的语音信号生成词，这有助于 Attention生成更好的表达，两者结合比CTC、Attention各自训练效果更好，所以是一个1+1大于2的结果。

第二个前沿问题是鸡尾酒会问题，指在嘈杂环境中，屏蔽周围说话声或噪音，将注意力集中在某一个人的声音上，听懂要关注的那个人的说话声音，这是较难解决的一个问题，目前利用麦克风阵列、选择更好的分离模型等办法都在尝试解决此问题。

第三个研究方向是建造一个持续预测与适应的模型;第四个研究前沿则有关远场识别以及如何做前端和后端更好的联合优化问题，通过做一个自动的系统，较好地分配信息的信号处理，使前端可以比较少地丢失信息，从而在后端把这些信息更好地利用起来。

科大讯飞胡郁：人工智能如何改变世界

图3 科大讯飞执行总裁、消费者事业群总裁胡郁

科大讯飞执行总裁、消费者事业群总裁胡郁则从人工智能的技术的应用与价值角度进行了分析，表示，在深度神经网络的进展方面，利用深度神经网络和大数据，特别是涟漪效应，使讯飞在语言识别、自然语言理解取得进展。在人工智能技术的应用价值上，一方面，改变人机交互的方式，从而改变消费者领域产品的形态，从最初的键盘、鼠标，到触摸，再到现在人机交互、语音交互的产品正成为一个新的方式;另一方面，人工智能可以通过从专家这样的稀缺资源学习，构建专家系统。

胡郁指出，人工智能的发展，随着运算智能、感知智能、运动智能和认知智能的发展，将对人类生活产生巨大改变，但是人工智能不会替代人类的职业，它会改变人类的职业，帮人类节省时间，让人类的时间使用更加有效。

思必驰俞凯：人机对话系统“智能的感知+认知的进化”

俞凯是上海交通大学教授、思必驰联合创始人/首席科学家，曾为英国知名语音公司VocallQ(现已被苹果收购)的创始人之一。28日上午，俞凯发表了主题为《迈向智能认知型对话交互》的演讲。

图4 上海交大教授、思必驰联合创始人/首席科学家俞凯

俞凯指出，目前，从语音识别精准度、搜索速度等感知角度来看，机器系统已逼近人类水平，例如思必驰上海交大实验室推出的VDCNN抗噪算法模型、PSD新型解码框架等，均在语音识别领域取得了成绩。但目前，仍有很多问题存在，如声源定位及追踪、远场、低功耗、非配合式语音交互、主题或应用领域的演变等等，其中“非配合”几乎是最难解决的问题，这种“非配合”往往体现在语音信号、语言范围等方面。

目前，除依靠“深度学习+大数据”来解决未来对话交互问题外，俞凯教授还强调以下几点：第一，交互的时机，要研究对话过程中什么时间切入最为自由，什么时间切入最为恰当;第二，强化学习是未来非常重要的发展方向。但目前，无论是研究机构还是工业机构，没有任何一家有全强化学习的系统，而都是混合一点的或者主要以规则为主的系统;第三，解决用户异常的处理;第四，自适应，在对话交互当中，语义理解的自适应要远比语音识别更重要;第五，大数据不能解决所有的问题，要逐步进行非结构化小数据处理，这是大数据之外我们所面临的挑战。俞凯指出，“智能的感知+认知的进化”将是未来人机口语对话系统发展的重要方向。

搜狗王小川：人工智能技术的应用与思考

人机大战是GMIS2017的一大看点，28日下午，在搜狗与VIP速记创始人五轮PK过后，搜狗CEO 王小川发表了《人工智能技术与应用思考》的主旨演讲。

图5 搜狗CEO 王小川

搜狗用识别、决策、生成这样的表达来谈论深度学习，王小川表示，搜狗最有感觉的突破是在识别和生成领域，并认同未来商业智能就是人工智能决策，语言理解是人工智能的皇冠，搜狗努力的方向就是以文字为核心、以语言为核心，去做语音、图像甚至包括翻译的工作。

王小川指出，搜狗在做的事情之一就是垂直问答系统，没有数据库、互联网资料作为输入，搜狗汪仔已经在《一站到底》已经战胜人类选手了。汪仔动用了全部搜索的力量，甚至可以与IBM Watson进行对比。但是，目前在那些不在人类现有知识范围内的知识，这台机器无法进行问答，汪仔还不能推理，无法作答。此外，辅助对话和海外搜索也是搜狗目前的两个重要业务，搜狗在翻译领域已经取得了突破，搜狗输入法的自动翻译功能已经可以为很多工作者带来便捷。

图6 加拿大麦吉尔大学语言学副教授Jessica Coon

国际领域的专家学者也解读了人工智能语音技术，加拿大麦吉尔大学语言学副教授、科幻电影《降临》科学顾问 Jessica Coon进行了《外星人、田野调查和通用语法》的主旨演讲。俄亥俄州立大学终身教授汪德亮发表了主题为《基于深度学习的语音降噪技术》的演讲，探讨分享了鸡尾酒会问题研究的当前进展、解决方案及其泛化等相关问题。

放眼国内，智能语音技术已然被推向了风口浪尖，这不仅加速了腾讯、阿里、百度、搜狗、科大讯飞等一线企业的产业布局，也为思必驰、出门问问等专业语音企业带来了极大机遇，资本涌动、新型创业企业不断涌现，使这一领域已成为一片红海。技术创新力是人工智能企业生存的关键，构建技术壁垒成为重中之重，但这一切的出发点，都是满足需求，为人类带来更加智能的未来。

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

三一重工2024年净利大增32%！全球化数智化低碳化战略成效显著

04-18

谷歌推出Gemini 2.5 Flash AI模型：性能卓越，成本更低廉

04-18

寡姐领衔！《侏罗纪世界4》全新特辑曝光，7月2日震撼上映

04-18

腾讯混元开源新插件：定制化角色图像生成，效果直逼GPT 4o！

04-18

台积电Q1财报亮眼：利润大涨60%，3nm制程占比高达22%

04-18

2025上海车展：马瑞利展示平台战略赋能客户多车型产品开发

平台化解决方案基于高度预开发的技术基础、预留了个性化定制空间,加速产品上市进程2025年4月18日,上海——全球汽车技术合作伙伴马瑞利将在2025上海车展上展示其基于战略平台化理念的技术方案。该理念旨在简化硬件开发流程,加快产品上市速度。在本次车展上,马瑞利将推出

04-18

易派客九周年再启新程数智赋能工业供应链高质量发展

2025年4月18日，中国石化旗下泛工业品电商平台——易派客迎来商业运营9周年。一直以来，易派客始终秉承“让采购更专业”的理念，深度服务中国石化主责主业，全面助力工业企业供应链数智化转型升级。2024年，平台交易规模达2254亿元，注册企业达17.7万家，品牌价值达110.

04-18

字节快手AI视频大战再升级，谁将问鼎技术巅峰？

04-18

4月18日A股概览：沪指微跌，通信设备板块资金净流入领跑

跌幅最多的概念板块为：乳业，转基因，预制菜概念，粮食概念，社区团购，分别为-3.53%，-2.95%，-2.78%，-2.77%，-2.66%。跌幅最多的行业板块为：旅游酒店，美容护理，食品饮料，农牧饲渔…

04-18

宇树科技新突破：民族舞机器人专利，科技与文化融合新尝试

04-18

杨紫维权再升级，6月黑粉案开庭引关注

04-18

南航暂停去哪儿销售资格，因违反销售代理协议损害旅客权益？

三言科技发现，确实如该博主所述，目前在去哪儿App中搜索不到南航的机票。对此，三言咨询南航客服，对方回应称，因去哪儿网近期出现部分违反南航销售代理协议的相关约定的情况，存在损害旅客权益的风险，南航临时暂停了…

04-18

前程无忧2025人力资源管理杰出奖颁奖盛典暨高峰论坛在厦门盛大启幕

4月18日以“人才向上、共筑未来”为主题的2025人力资源管理杰出奖颁奖盛典暨高峰论坛在厦门香格里拉酒店隆重举行。本届活动汇聚了全国近200家获奖企业代表和人力资源行业专家，共同探讨智能时代下人才战略的变革与创新，见证杰出雇主荣耀时刻。作为国内人力资源领域最具

04-18

阿斯麦：中国市场芯片设备需求超预期，美设厂计划暂无

04-18

王倩解读：动力电池安全新国标，如何为绿色出行筑起安全防线？

04-18

点击查看更多 +

全站最新

路虎进口揽胜及运动版汽车存隐患，14辆车紧急召回！

泼水节理想汽车被“语音开门”？高管回应：实为副驾手动开门

比亚迪海狮07DM-i智驾版预售，预售价区间18.98-22.98万，配置亮点抢先看！

寡姐领衔！《侏罗纪世界4》全新特辑曝光，7月2日震撼上映

一加平板2 Pro性能曝光：骁龙8至尊版+16GB内存，跑分成绩抢眼！

智驾监管升级，特斯拉2024年OTA召回量领跑市场

热门内容

本栏最新

字节快手AI视频大战再升级，谁将问鼎技术巅峰？

4月18日A股概览：沪指微跌，通信设备板块资金净流入领跑

宇树科技新突破：民族舞机器人专利，科技与文化融合新尝试

杨紫维权再升级，6月黑粉案开庭引关注

南航暂停去哪儿销售资格，因违反销售代理协议损害旅客权益？

王倩解读：动力电池安全新国标，如何为绿色出行筑起安全防线？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.