信息无障碍通道
您的位置:首页>>业界动态

罗永浩高调站台的讯飞是传说 关于语音输入的四个误区

发布时间:2016-10-21  来源:站长之家    背景: 无障碍通道

  看相声还是看手机?当罗永浩“意外”抖出了某语音输入的包袱后。一把刷屏好手之称的罗永浩这次是回归广告界了吗?或许是。那么,因直播惊艳而走火的“老干部”科大讯飞真如老罗展示“上了天”吗?

  事实上,在语音识别这个几近成熟的市场内,技术和产品的胜负早已有定夺。要了解语音输入和语音识别,应该先走出四大误区。

  误区一:语音识别是个新领域吗?

  1950年,计算机之父图灵在《思想》杂志上发表了一篇题为《计算的机器和智能》的论文。在这篇文章中图灵提出了影响至今的图灵测试,后来,计算机科学家们认为,如果计算机实现了语音识别、机器翻译、文本的自动摘要或者写作、战胜人类的国际象棋冠军、自动回答问题中的一件事情,就可以认为它有图灵所说的那种智能,所以语音识别是科学家们从上个世纪50年代就“庖丁解牛”的领域。

  当科学家进行语音识别研究之初,最初是陷入了计算机需要模拟人脑的误区。直到20世纪70年代,在IBM华生实验室,贾里尼克的团队花了4年的时间,开发了一个基于统计法和数据的语音识别系统后,语音识别有了巨大飞跃,识别率迅速提高到90%以上,同时语音识别的规模从几百词上升到两万多词。从此,语音识别就从实验室走向实际应用了。

  误区二:讯飞是个toC的公司吗?

  当然,从用户群来说,哪个产品的用户数多,则代表着该产品被用户的认可度更高。

  事实上,科大讯飞一直是个2B(面向企业用户)服务的公司,将自己的人工智能服务授权给其他企业是主要的商业模式。虽然科大讯飞在最近几年也开始发力2C(面向消费者)的产品,比如智能音箱、录音宝、录音笔等硬件,以及锤子发布会火了的“语音识别”,但这些产品在市场上的占有率并不算高。

  那么,到底什么语音输入法是2C用户为主,被用户使用次数最多、认可度更高的呢?数据会说话。答案是历经五年发展的搜狗语音输入。据了解,截止目前,搜狗输入法总用户量已经超过5亿,其中有相当部分的用户会用到语音识别功能,每天拥有超过1.9亿次的语音请求,是中国语音输入量最大的应用工具。

  误区三:没数据就能做好语音输入吗?

  “我的办公室里每开除一个语言学家,我的语音识别系统错误率就能降低一个百分点!”当大神贾里尼克说出这句话的时候,他就意识到语音识别和语言语法关系不大,而是和语料数据息息相关。

  要提升语音输入用户的产品体验,必然需要积累大量的数据。搜狗语音识别背后就是由搜狗搜索引擎大数据支持,加之积累了十年的搜狗输入法云词库数据,这样才提升了用户的使用体验,从大数据的角度来看,科大讯飞在短时间是难以赶超搜狗的。

  搜狗和科大讯飞最大的不同是,搜狗是一家互联网企业,其互联网的产品布局更多,服务更全面,语音识别不仅能用于搜狗语音输入法,还能用于搜狗搜索、搜狗地图,一方面采集更广泛数据,另一方也将用户体验提升至一个更高的水平。

  误区四:语音识别上屏是初亮相

  “天啦噜,老罗一边演讲,一边字幕就上墙了!太神奇了!”能有类似感慨的不能不说是语音识别界的“小白”。

  今年7月,搜狗公司CEO王小川在极客公园“奇点·创新者峰会”,就首秀了演讲内容在现场实时生成滚动字幕,同步的字幕引起了现场观众极大的兴趣,纷纷起立拍照。在演讲结束后,现场语音识别成果立刻生成了完整的演讲稿,观众通过扫描二维码即可阅读。利用搜狗公司的语音识别技术,王小川的演讲内容显示为文字的准确率已高达97%以上。

  此外,搜狗语音输入的新功能“语音修改”也首次展示。用户对着手机说出一段文字后,再通过自然语言的方式将语音识别错误的地方进行修正,赢得了现场热烈的掌声。因为搜狗语音交互引擎“知音”所具备的利用自然语言交互的语音修改能力,搜狗语音不仅要实现“能听会说”,还要求具有“能理解会思考”的能力。

  看清误区,讯飞语音输入不再上天了吧。当然,事实是不比不知道,一言不合就上视频。

  搜狗和科大讯飞语音输入识别效果PK:

  http://card.weibo.com/video/h5/detail?object_id=2017607:f785d6a844cb68d7a4094e1dd454eb42&sso_redirect=1&hassetsso=1&from=singlemes

特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:站长之家

本文评论
BCS 2020“安全运营中心建设与发展高峰论坛”成功召开
8月12日,BCS 2020安全运营中心建设与发展高峰论坛成功召开。论坛邀请到中国电子信息产业发展研究院...
日期:08-12
BCS 2020举办区块链安全论坛 多方专家共议区块链在垂直行业的应用
8月11日下午,有着网络安全行业“达沃斯”之称的北京网络安全大会(以下简称BCS 2020),正...
日期:08-12
腾讯Q2财报:小程序交易额环比回升 公众号内容消费重焕活力
8月12日,腾讯发布二季报,数据显示,2020年上半年实现收入1148.83亿元,同比增长29%;Non-IFRS净利润301...
日期:08-12
应对联发科强劲需求,芯片测试商京元电子与矽格准备提高产能
8 月 12 日消息,据国外媒体报道,在此前的报道中,外媒曾提到在 5G 智能手机处理器方面有很大进展...
日期:08-12
摩托罗拉新机XT2081-2获FCC认证:配5000mAh电池
据外媒报道,一款型号为XT2081-2的摩托罗拉手机出现在FCC认证网站上。虽然该网站没有透露手机的营销...
日期:08-12
苏宁易购引领未来零售5G发展趋势,终端裂变重塑零售形态
近日,全场景智慧零售服务商苏宁易购与全球化监测和数据分析公司尼尔森联合发布首份零售行业5G应用发...
日期:08-12
台积电 3 家晶圆厂设备供应商 7 月营收同比大增,最高接近 80%
8 月 12 日消息,据国外媒体报道,为苹果等公司代工芯片的台积电,近几年在芯片制程工艺方面走在行...
日期:08-12
京东全资控股五星电器,成立新公司 “京东五星电器集团”
8 月 12 日消息,京东宣布全资控股五星电器,成立新公司拟定名为京东五星电器集团有限公司。
日期:08-12
BCS2020技术峰会:内生安全框架推动网络安全技术体系升级
8月12日,2020北京网络安全大会(BCS 2020)技术峰会正式召开。来自中、美、以等全球顶级的网络安全技...
日期:08-12
消息称三星与 ARM 和 AMD 合作,目标成为第一大 Android 应用处理器制造商
8 月 12 日消息 据 Business Korea 的最新报道,三星的目标是通过与 ARM 和 AMD 合作,成为第一大 A...
日期:08-12
近80% CEO预测远程办公是趋势 BCS2020举行远程办公与智能终端安全论坛
今年年初,突如其来的新冠“黑天鹅”,加速了远程办公的落地,远程办公系统与智能终端安...
日期:08-12
卢伟冰:Redmi K30 Pro因高刷缺席被喷 这次投入2亿重做K30至尊纪念版
作为Redmi的旗舰产品,Redmi K30 Pro因60Hz AMOLED屏成为不少米粉心中的小遗憾。
日期:08-12
Facebook 面临新指控:Instagram 被诉非法收集用户生物识别数据牟利
Facebook 最近又面临一项新的指控,称该公司非法收集用户的生物识别数据。这次诉讼的对象是 Faceboo...
日期:08-12
一加Nord新配色将于10月初推出 还有更便宜版本出售
据外媒消息,一加将于10月初推出一加Nord新配色——尘灰色(Gray Ash)。
日期:08-12
Realme证实C12/C15入门新机即将登陆印度市场 售价或低于10000卢比
在曝光了各种认证信息后不久,Realme 已证实将向印度市场投放 C12 和 C15 入门新机。早些时候,售价...
日期:08-12
TCL 发布 Mini LED 屏电视:最高支持 120Hz 可变刷新率
TCL 发布了最新一代 5 系列和 6 系列 Roku 电视,其中 6 系列电视最大特点是有 Mini LED 显示背光技...
日期:08-12
Nutanix混合云基础架构现已支持亚马逊云服务(AWS)
携手AWS,Nutanix Clusters支持应用云间无缝迁移及统一操作,助力企业加速云上旅程
日期:08-12
消息称可折叠苹果 iPad 2023 年发布:无铰链 + 屏下摄像头 + 3nm 芯片
关于可折叠 iPad 的讨论已经在进行中,有传言称该平板电脑的显示尺寸与 MacBook 相当。今天,推特爆...
日期:08-12
XSKY星辰天合发布全新下一代分布式文件系统XGFS
非结构化数据正以前所未有的速度增长。IDC的预测表明,到2025年,全球将有80%的数据是非结构化的。...
日期:08-12
买iPhone最值的时候来了!京东热8购物季iPhone 11低至4599元
暑假过半,考研复习进入关键时期。考研是一项全靠主观能动性的学习,调整好复习状态固然重要,但学...
日期:08-12
  专栏介绍
阳光不锈 的专栏
阳光不锈发表的文章
积分:
自我介绍 :