ITBear旗下自媒体矩阵:

专访分音塔科技关磊,AI翻译机是蓝海市场有准儿了?

   时间:2018-06-20 18:03:39 来源:互联网编辑:星辉 发表评论无障碍通道

6月,北京分音塔科技有限公司(以下简称“分音塔”)推出了第二代人工智能翻译机新品——全球首款出境游综合服务产品准儿WiFi翻译一体机,也掀开了AI语音翻译市场的面纱。曾经被上帝打乱的语音能否通过科技再一次建造人类的巴别塔?面对火热的市场需求,语音翻译市场是否是旅游技术的新蓝海?

微信图片_20180620150959.png

技术壁垒高

即时语音翻译技术早在几年前已然出现。

2015年,谷歌推出Real Time实时语音翻译软件,微软官方2016年年底发布的Microsoft Translator,苹果基于OS系统上的iTranslate等。这些软件声称具备翻译60-80种语言,支持语音识别和发音,甚至让多达100人之间实时翻译交谈等功能。2017年,日本科技公司Logbar推出一款翻译神器ili,外形类似录音笔,0.2秒即可实现日语、中文和英语之间的高精度互译。

而国内的语音科技早在2007年科大讯飞股份有限公司成立之时肇始,随着“语音云”的出现快速发展。随后,腾讯、百度等科技公司也迅速跟进,相继推出各自产品。2016年,分音塔科技创立,在多年积淀的技术基础上迅速进入市场,发明了全球首款带屏的人工智能翻译机、中国首款人工智能翻译机,推出清华准儿。有业者认为,“中国企业正处于发展阶段,但相比谷歌、苹果等显得声势不足。”

对此,分音塔CEO关磊表示:现在技术还处于初级阶段,企业更关心的是如何迭代升级,满足客户需求,一旦产品真正成熟,自然会赢得更多的关注。

与机器翻译一样,语音处理一直是计算机科学家的研究课题,但这一领域的进展要慢得多,其主要原因是用于语音处理的数据类型难以界定。ASR和TTS显然也是依赖于口语数据,但是口语数据可能带有语法错误、无意义的停顿、情感色彩,也包含了更多的口语化表达,且词汇多变。另外,人类语音类型具有多样性,口语句型的改变也比书面语言的更新迭代要快得多,这使得基于规则的机器翻译在很大程度上不适合处理口语输入文本。

技术的复杂性,导致获得高质量的ASR系统的成本很高。然而,仍有几项语言翻译的应用融入到了社会生活中,它们或用于便携式设备 (智能电话) ,或用于桌面,或作为在线服务,涵盖了20到80种语言。

关磊对品橙旅游说:“人工智能翻译机核心为语音识别技术、自然语言理解技术、机器翻译技术、语音合成技术,其中机器翻译技术最难攻克,这恰是清华准儿翻译机的核心优势。清华大学团队分音塔科技专注于语音识别、声纹识别、语种识别、情绪识别、lp机器翻译TF等一系列技术。AI翻译整个流程基本上是四步,第一步是语音识别,第二步是语义理解,第三是机器翻译,第四是语音合成,这四步下来就可以看出不是一个很简单的技术。”

科大讯飞执行总裁胡郁也表示:认知智能到目前还是人类所独有的,人工智能在认知方面和人还有很大差距。但他也说:“在计算方面人和动物都不是计算机的对手,人和动物在长期竞争中具备的感知智能和运动智能,AI正在逐步具备。”

实际上,中国在人工智能翻译机领域走在世界前列,尤其是中外沟通翻译上。人工智能翻译机依赖于云端人工智能技术提供支持,基于海量的汉语语料、亿万用户规模和多元应用场景,中国的人工智能翻译机显然更具有原生优势。

技术对于语音翻译企业来说是最大的护城河,但是在一切都在快速变化的今天,拥有核心技术还不够。

快速迭代的市场

吴晓波在《未来十年,我们所认为的能力荡然无存》中说:“城墙”是你的核心技术,当你有核心技术的时候,你的核心技术有没有不断地迭代和创新?

语音翻译绝对是快速迭代的市场。

以分音塔为例,2017年一代准儿翻译机刚上市的时候,支持5个语种实时互译,两个月以后,升级到22个语种,2018年4月升级到39个语种,细分到了51个国家的口音。“产品每一两个月都会自动升级,所以我们硬件方面做了很多的冗余,预留了非常多的空间。”关磊说。

除了语种更为丰富,准儿翻译机采用了先进的TZ深度学习算法、TZ神经网络算法,应用四麦线性差值阵列,会越用越准。准儿翻译机特别在旅游场景进行了海量数据驯化,在旅游场景的翻译准确率会更高。根据专业评测显示,准儿翻译机中英翻译准确率高达97%,中日高达90%,整体高于同品类产品。

一年之内,分音塔在第二代产品准儿WiFi翻译一体机上带来了五大提升:首先,支持离线翻译,不联网也能用,其中日语离线语音识别技术是中国的0突破;其次,支持WiFi、4G卡、虚拟卡联网,一键开通联网,还可一机多用,随时分享给手机、Pad使用,简化设备,便捷出行;再次,首创翻译机AI识物拍照,除了可拍照翻译菜单、路牌、文字、标识等,也可拍动植物,通过AI识别进行信息详解。更妙的是,还可拍餐厅等消费场所,用户可以获知点评推荐信息;同时,新增全球景区导览功能,变身AI语音导游;此外,新一代产品还提供AI语音秘书功能,通过语音交互,就能轻松查询导航、汇率、天气等信息,享受便捷服务。

据悉,分音塔科技的APP“准儿翻译”,以及准儿翻译服务号,都可提供免费翻译的业务。但从市场来看,显然用户现在越来越认可翻译机,原因主要是其拥有更多语种、更高准确率、更便利交互。

市场前景千亿

语音识别与语音翻译通过手机端程序在旅游场景的应用已被人们熟悉。现在,它正在逐渐成为跨语言医疗环境中的重要辅助工具,但这类应用是否能带来巨大的市场利润却还没有一个肯定的答案。

但关磊对此表示“不急”与“乐观”。“这么多技术,这么多语种,全世界没有一个公司能搞定,如果真的可以有这样的公司,它的市值可能会十倍于google。”

科大讯飞主要走B2B的路,而分音塔则B2B2C兼备,更希望直接面对客户,“只有服务用户才有价值”是关磊一再强调的观点,用户可以高频使用,也带来更多好的建议,使得技术可以不断完善,这也许是他们最为重视的。

在2B领域,通过商业模式创新,准儿WiFi翻译一体机从销售扩展到租赁领域,面向旅游行业如OTA旅行社、目的地服务商、景区、酒店、政府机构等开展深度合作,为其精准引流并升级服务。实际上,高昂的科研费用很难靠现在的市场租售来支持。他们看到的是未来广阔的前景。

目前,人工智能成为科技新风口,据统计,2017年全球仅传统的翻译产业规模就将达到445亿美元,2020年有望突破500亿美元。通过人工智能加持,翻译市场将有可能迎来千亿级更大规模的爆发机遇。而2.69亿的出入境人次,也是分音塔看重的市场机遇。

以教育、医疗、司法为主赛道的科大讯飞5月初发布一季度报告显示, 公司一季度实现营业收入比去年同期增长63.25%,实现净利润8,199.22万元,比去年同期增长10.83%。同时,公司员工规模较去年同期增长近3000人, 公司规模持续扩张,研发与平台及各赛道投入整体加大。 截止到2018年6月,该公司市值达到745亿元人民币左右。

而以旅游为主赛道的分音塔2017年12月成功获得东方国狮3000万Pre-A轮融资,估值3亿元。

微软全球执行副总裁沈向阳曾表示:认知智能是人工智能下一步皇冠上的明珠,谁如果在认知智能领先,就有可能在人工智能的竞争中处于领先地位。

把上帝打乱的语音重新归序,人类也许会走进新的时代,人工智能翻译机市场已经在爆发的前夜,用关磊的话说:“未来已来。”

举报 0 收藏 0 打赏 0评论 0
 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  网站留言  |  RSS订阅  |  违规举报  |  开放转载  |  滚动资讯  |  English Version
关闭
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群