信息无障碍通道
您的位置:首页>>业界动态

腾讯云小微首次技术开放日,揭秘AI语音背后的奥秘

发布时间:2020-07-20  来源:互联网    背景: 无障碍阅读通道

  随着科学技术的发展,自动化技术将机械控制进化为信号控制,帮助工业生产和日常生活更加便利高效。

  同时人工智能开始替代人类的双手进行部分工作,比如AI语音助手接收声音信号通过数据分析和识别,响应人类指令完成指定操作。

  AI技术的每一次革新,都会对社会生活进行一次深度改变。从智能音箱走进千家万户,到智能车联陪伴日常行程,在数字化升级、消费转型的风口面前,我们可以期待怎样的AI技术打开未来的智能生活?

  在刚刚结束的腾讯技术开放日·腾讯云小微AI语音专场,来自腾讯智能平台产品部AI语音专家带来关于语音识别、自然语言理解、智能对话机器人等行业应用探索等领域的精彩分享,从腾讯云小微AI语音助手的角度,揭开AI语音助手在技术和应用领域的探索和最新成果。

  云+端协调、软硬件一体,打造鲁棒的车载语音识别系统

  在直播中提到,就构建鲁棒的车载语音识别系统而言,人工智能首先要解决的难题就是数据分析与识别,只有将各个行业的宝贵经验搜集并形成数据库,再通过电脑自动识别知识并进行分析,才能从亿万条数据中剥丝抽茧,找到匹配用户使用场景的正确反馈。

  但是在实际应用环境如汽车使用过程中,车载语音识别面临着重重挑战。在语音识别将人类的声音信号转化为文字或者指令的过程中,用户口音、环境噪声、海量POI以及场景化语音均构成影响识别系统决策的变量,尤其考验语音识别系统的基础稳定性。

  为此腾讯云小微AI语音助手在接收信号后,通过声学前端处理,对丰富的声音信息进行甄别,分流至本地语音识别、云语音识别以及云+端协调机制进行精准识别,提供更为精准的技术解决方案。

  以常见的环境噪声处理为例,当用户声音信号发出,在路噪、风噪、空调、音响等不同噪声类型的干扰下,很容易让车载语音识别发生理解偏差。腾讯云小微AI语音助手从车内语音交互场景出发,通过腾讯自有技术和硬件设备完成回声消除、噪声抑制以及定位和拾音,确保得到干净的语音信号,同时在声学模型层面从训练数据、特征提取、网络结构等方面进行针对性优化以提升识别系统对噪声的鲁棒性。

  在基础能力方面,因为有腾讯云加持,再根据自主研发的全栈AI技术,整合前端降噪、语音识别、语义理解、人声合成、图像识别能力,能够提供云到端的完整的AI解决方案。

  在直播中,我们还看到了腾讯云小微AI语音助手在不同用户口音输入语音情况下如何做出精准反馈。腾讯云小微AI语音助手的鲁棒性源自容错性极小的两套处理方案,一是基于迁移学习的分地域模型方案,二是引入地域向量的单模型方案。在这样的智能车载语音识别系统下,腾讯云小微AI语音助手联合腾讯车联TAI已合作多家国内头部车企和热销车型,通过腾讯云小微车载语音识别系统的助力,无惧用户口音,精准识别语音指令,满足车内交互场景的语音需求。

  实现深度学习的自然语义理解,打造基于理解的人机交互

  自然语义理解是人机自然对话的核心技术基础。如何让语音助手实现家庭、汽车和办公室的无缝连接,甚至可以预测并解决用户的需求,只有懂“深度学习”并可以进行“理解”的语音技术才能胜任这样的要求。

  在技术开放日上,深入探讨了这项AI技术如何实现深度学习。人工智能技术基于数据的逻辑分析,在一定程度上的确可以实现自我学习,但是相较于人类的情感需求、精神状态,再智能的AI语音助手也难以读懂主人的“心”,因此具备理解能力的人机交互成为技术攻关的重点所在。

  根据腾讯技术开放日·腾讯云小微专场直播所演示,腾讯云小微AI语音助手以高质量低延时语音合成、智能语音交互系统,进化成为真正以用户需求为导向的个性化服务。

  物联网时代,语义理解成为语音交互的核心所在。通过声学前端处理,降低干扰信号、抑制回声,提升语音识别效果、语音唤醒效果,随即将文字转换为命令字,通过语料模型匹配,做领域分发。在这个过程中腾讯云小微AI语音助手支持自然语音识别,语义理解、语音指令随意说,系统均可很好的理解并执行,同时将文本转化为语言流,在终端设备上进行语音播报。

  仅以智能语音交互系统为例,腾讯云小微AI语音助手向我们展示了在智能车联模式中,人车之间愉悦的交互体验。高效自然的语音输入方式,输入速度远高于手动输入;安全行车释放双手,切换导航、调换歌曲不分散注意力;更重要的是腾讯云小微AI语音助手能够读懂车主语音中所包含的语气、情绪等丰富信息,以做出正确的判断,让行车过程省心省力。

  高质量低延时语音合成则为我们展示了智能语音系统的深度学习能力。基于“互联网+”自然语言理解发展成自然的人-机器交互方式是指基于自然语言理解技术重塑人与机器之间的交互方式,使自然语言成为人-机器之间进行交互的自然接口。通过腾讯云小微AI语音助手的语音合成能力,支持纯中文、纯英文以及中英混搭的合成场景,提供50+种不同男女声音色,个性化音色定制能力,王者荣耀妲己、李白定制语音包;采用业内领先的算法,优化不同场景中的语音音色,让AI语音助手发声更为自然。

  这是因为腾讯云小微AI语音助手采用专门为机器设计的语言编写程序来“告知”机器,当用户发出某项声音指令时,机器通过深度学习掌握指令的真实意图并执行,达成机器说脱口秀的效果。怎么让机器的音质高保真、韵律更加自然连贯?腾讯云小微AI语音助手给出的答案是神经网络语音合成系统,整体架构上使用序列建模的声学模型与神经网络声码器。通过GAN优化Parallel WaveNet、WaveRNN、FeatherWave等技术升级,达到高质量、高稳定性的自然人声。

  客服机器人的功能设计与实现,开放能力降低企业智能化成本

  如何通过AI语音助手帮助企业级用户进行商业变现?以客服机器人的接入与实现角度,指出能力获取的方式之一正是在技能开放平台通过标准协议、账号打通、商业转化、推荐运营全面由开发者定制方案,构建由开发者到用户的语音服务路径,让开发者以成本最小化接入客服机器人,实现个性化和精准服务效果最大化,在服务咨询阶段引入客服机器人功能,对节约前端客服人力,提升服务运营效率。

  在腾讯云小微AI语音专场我们了解到,腾讯云小微技能开放平台是唯一支持小程序接入的AI行业解决方案,目前已经开放与京东和大众点评的合作,用户语音指令即可操作在京东和大众点评的购物和服务,帮助小程序实现更智能化的用户体验。

  腾讯云小微AI语音助手以自身技术为突破点,在客服机器人的实现与接入上,构建起完整的工程闭环。面对未知状态(动态)、非结构化环境下客服机器人的环境感知、环境交互、环境功能等三个方面的需求,在功能设计与实现层,按智能环境系统设计提供客服配置、客服使用、发现问题、解决问题的手段完成任务需求。

  在客服配置上,腾讯云小微AI语音助手将文本模式分类拆分为知识库检索、服务售前、服务售后等模式,检索为功能性检索,售前、售后可根据问题回答策略转向人工模式。其中分层模块的搭建上注重知识库的基础搭建,模块分工明确,流程简单。

  在客服使用中,采用多线程方式、人机协同,区别普通的聊天机器人,依靠系统功能事件&指令的智能交互,形成更为精准、人性化的索引推荐。

  当然,客服机器人还需要加强训练,挖掘算法、索引堆砌并不能解决问题,更多需要明确的系统规则和流程。想要发现问题、解决问题,重要的是实现人工、机器人的交互,在线客服、模型算法、统计监控、配置平台,缺一不可。例如从人工服务界面引用客服机器人的索引,进而给出服务明确的答案。只有快速迭代优化的深度学习,才能适应数字化时代的商业发展需求。

  在客服机器人的接入上,应用入口有电商平台网站、WAP平台、微信小程序入口、内部客服助手、语音交互方式等,实现形式基本都是在线模式,webchat方式通过IM、微信小程序、APP入口等实现。

  在自然语言处理技术方面,我们主要分享了腾讯云小微的两项前沿技术,1)在2019法研杯阅读理解赛道中获得冠军采用的方案;2)一篇关于信息抽取的发表在人工智能国际会议IJCAI-2020上的最新论文。通过直播,我们看到了腾讯云小微在知识抽取与问答领域的技术积累,并以丰富的案例形象生动的展示了相关技术在实际应用中的作用。

  不仅如此,我们还能从腾讯云小微AI语音助手强大的开放能力中发现更多领域的应用探索,比如为企业定制品牌IP形象。这在以往不敢想象,在5G、直播风口,虚拟人以安全、可控、高效成为众多企业热衷的对象,而通过腾讯云小微语音助手提供智能语音交互,根据不同硬件终端和应用场景,可以触发丰富的表情动作,快速换形象。因为腾讯云小微AI语音助手的全双工交互功能,高度智能化免唤醒、主动引导对话,再加上腾讯系正版IP授权服务,AI语音助手的商业变现价值拥有广阔的市场机会。

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:互联网

兰州发展数字经济是认真的 中软国际解放号就吃这一套
“当这个时代到来的时候锐不可当,万物肆意生长,尘埃与曙光升腾。江河汇聚成川,无名山丘崛起...
日期:03-27
此时此刻艺术展北京开幕,天猫小黑盒携润百颜共同探索时光魅力
2021年3月26日,天猫小黑盒携手润百颜在北京时代美术馆举办了润百颜【修瓷大师】系列新品发布活动。...
日期:03-27
跑分曝光:微软 Surface Laptop 4 或使用过时的 AMD 处理器
3 月 27 日消息 此前消息称微软计划在 4 月的某个时候推出 Surface Laptop 4,将采用英特尔第 11 代...
日期:03-27
什么值得买App 10.0全新升级:值法上线、百科升级、开放社区
3月25日,消费内容社区“什么值得买”官方宣布正式上线全新App10.0版本。新版本对首页和...
日期:03-27
消息称苹果 AirTags 售价 39 美元,直径 32 毫米
3 月 27 日消息 根据爆料者 Max Weinbach 提供的尺寸,苹果传闻中的 AirTags 物品追踪器将比 50 美...
日期:03-27
爱芯科技CEO仇肖莘:创业之路要“有坑趟坑,遇水搭桥”
2020年,新冠疫情加速各行各业数字化转型。在医疗健康、人工智能、企业服务、先进制造等技术创新领...
日期:03-26
或年内发售,和雷蛇灵刃一起追逐《消逝的光芒2》吧
《消逝的光芒2》终于有消息了,或将年内发售!前段时间一条《消逝的光芒2》全新实机演示视频再度唤起...
日期:03-26
2021手机去哪买?来京东之家感受全新升级的超棒购物体验!
“前两周来就注意到这里要开一家新店,没想到是京东之家。平时常在京东上买电器,这还是第一次来京...
日期:03-26
飞算智能客服平台:提升咨询处理效率300% 客户满意度90%
伴随着人口红利见顶,降本增效已经成为企业经营的一个常态化目标。与此同时,随着互联网、物联网等...
日期:03-26
AWE 2021展完美落幕,TCL解锁众多“黑科技”,引领智慧生活新发展
3月25日,以“AWE新十年,智竞未来”为主题的AWE 2021展在上海虹桥国家会展中心完美落幕...
日期:03-26
何以全球领跑?天津展台铃一系列大动作吹响全球化征程冲锋号
成立联合国电动出行研究院、重磅首发超智版智能电动车及无线充电技术、发布《电动车出行白皮书》及...
日期:03-26
小米“造芯计划”从未停止:“澎湃”芯片已量产,3月29日见!
ITBEAR 3月26日消息,小米科技于今日上午再次官宣有关3月29日举行的小米春季发布会上的新品—&...
日期:03-26
虎牙正式上线直播互动开放平台
3月26日消息,虎牙直播互动开放平台正式上线,该平台将为游戏厂商、工作室,带来一系列定制的游戏直...
日期:03-26
B&O 发布 Beoplay HX 头戴降噪耳机,续航 35 小时
3月26日消息 来自丹麦的音频品牌 Bang & Olufsen 昨晚发布了全新的头戴式降噪耳机 Beoplay HX。...
日期:03-26
海信智慧生活发布行业首个家庭社区深度融合智慧成套解决方案
下班回家,当你开车到达社区门口的同一时间,家中的空调、热水器同步打开,并自动调整到当季最合适...
日期:03-26
十铨成功开发可超频 DDR5 内存:电压支持到 2.6V 以上,超频空间更大
3 月 26 日消息 根据十铨官方的消息,十铨科技在完成标准型 DDR5 U-DIMM 及 SO-DIMM 并与板厂合作验...
日期:03-26
氢 OS 11 正式版来了,一加 7/Pro 国行推送安卓 11 系统更新:焕新 UI 视觉
近期一加社区发布了【Android 11 稳定版】H2OS For OnePlus 7/OnePlus 7 Pro 第一版更新公告,一加 ...
日期:03-26
AI x IoT全面落地,TCL智屏2020年全球销量达2393万台,全球第三
TCL电子控股有限公司今日发布截至2020年12月31日止年度之全年业绩,公司2020年全年实现营业收入509....
日期:03-26
“集善畅聊助残计划”落地天津,助力信息无障碍建设
2021年3月24日,中国残疾人福利基金会与杭州方得智能科技有限公司共同启动“集善畅聊”助...
日期:03-26
英伟达 RTX 3070 Ti 规格曝光:最高配备 16GB GDDR6X 显存
3 月 26 日消息 根据外媒 VideoCardz 的消息,即将发布的 GeForce RTX 3070 Ti 将搭载 GA104-400 完...
日期:03-26
  专栏介绍
爱萌妮儿 的专栏
爱萌妮儿发表的文章
积分:
自我介绍 :