信息无障碍通道
您的位置:首页>>智能设备

百度大脑OCR技术加持白描App:让AI成为视障者的眼睛

发布时间:2021-08-27 14:13  来源:互联网    背景: 无障碍阅读通道

  现实中,你可以轻松无障碍的阅读各类平面印刷文字以及身边的一切,或许你未曾想过,视障人群该怎么办呢?

  统计数据显示,中国大约有1700万的视障群体,相当于每100个人中就有超过1位是视障人士。但我们在日常生活中却很少见到他们,那是因为视障群体在日常生活中会有诸多不便,出门对他们而言危机四伏。AI有可能成为他们的“眼睛”吗?

  成为他们的眼睛:白描App与视障群体的故事

  如果手机上只能有一款App,你会选择哪一款?视障人士安之坚定地给出了答案——白描。因为白描App让视力不佳的他用另一种方式“看”清世界,文字不再遥不可及。他用白描“看”过优美的诗篇,“听”过动人的乐章,甚至在独自上楼看不清所在楼层时,白描也准确地将答案告诉了他,将他从窘境中解救出来。一个App让曾经望“字”兴叹的他更加勇敢的走出家门,参与丰富多彩的生活。

  “白描是我的眼。”同为视障人士的小杰从不吝啬对白描的夸赞,甚至直言白描是视障伙伴赖以生存的工具。白描帮助他解决了生活的难题,从各类电器、数码产品、药品说明书到各种洗漱用品包装都可以识别,他还可以给可爱的小侄女讲绘本故事。如果没有白描,这种事情是他难以想象的。

  白描是如何做到被视障群体视若珍宝的呢?白描App是一款简洁高效的OCR文字识别软件,不仅简单好用,而且设计美观,可以轻松实现“拍照-识别文字-朗读结果”一系列流程。同时,白描适配了手机无障碍辅助功能,视障者可以在手机上非常轻松地操作。

  “白描”这个词本意是一种文学写作手法,鲁迅先生曾把这种手法概括成十二个字,即“有真意,去粉饰,少做作,勿卖弄”。白描App的开发者陶新乐正是这样的一个人,他观察到了不同人群的实际需求,用虚拟世界的代码满足了现实世界有需求的人,让他们的生活变得更加美好、便捷。

  白描App开发者的心路历程:切入不同场景、优化产品细节

  你或许很难想象,作为一名个人开发者的陶新乐,他最早开发白描App是为了女朋友。陶新乐的女友热爱阅读,经常做读书笔记。为了减轻抄录压力,她尝试使用了当时市面上的各类文字识别软件,但她发现:有的软件操作流程繁琐,有的费用高昂,有的则识别不准确……看到女朋友痛苦不已,陶新乐当下决定亲自做个体验好、效果佳的OCR文字识别工具给女朋友使用,并且很快付诸了行动。这或许就是开发者独有的浪漫。

  然而,一款App的开发过程是充满未知与挑战的。在当时的条件下,开发一款具有OCR功能的软件,面临的一个巨大挑战是:如何让文字识别的又快又准。因此,他调研了市面上提供此服务的厂商,并对不同厂商的产品进行了对比,尝试识别不同场景的图片,找出识别效果最好的那个。于是他发现,百度大脑AI开放平台的OCR技术能力和使用体验都是最好的,尤其是识别准确度更领先于其他厂商,所以在2017年他就毫不犹豫的选择了百度OCR技术,并一直使用至今。

  但是优秀的底层技术并不意味着全部,百度大脑OCR已提供近60项技术能力,好的技术也需要应用于匹配的场景才能发挥更大的价值。

  于是,陶新乐首先对白描的使用场景做了细分研究,比如:学生上课拍PPT提取文字记笔记、企业员工把纸质合同扫描成电子版并且制作PDF、把纸质表格转成Excel电子版、翻译图片上的文字、老师拍摄并识别试题后对试题再加工、律师用来提取纸质文书上的文字等等。特别的是,视障人群特殊的使用需求,他都有关注和调研。

  考虑完用户的使用场景之后,再者就是对产品的不断打磨。当时,图片转文字常常会有识别错误的情况发生,为了弥补这一问题,在识别之前,白描APP会进行一些技术上的处理,比如图像压缩如何保证清晰度又尽量减小图片大小;如何在进行长图自动裁剪时,检测到长图的空行位置自动裁剪,且不会裁到文字;如何针对文章进行自动分段,更便于读者阅读等等。这些精细化的产品设计保证了图片的清晰度,让文字信息更易于被识别。而在识别之后,白描的校对功能,可以让识别结果与原图显示在同一界面上,方便用户快速找到需要修改的地方,在此基础上进行编辑。

  依托百度优秀的深度学习算法和基于海量优质数据的预训练模型,以及白描App的图像预处理能力,最终实现了关键字段识别准确率99%+。看到女友使用白描时绽放的笑颜,陶新乐觉得一切都是值得的,他也希望更多人能够享受到这份快乐。

  成功的背后:用“匠人”之心雕琢产品之光

  程序员出身的陶新乐在做产品这件事上一直怀揣一颗“匠人”之心。陶新乐提到,AI在落地的过程中会遇到很多的困难,很多时候都是一边踩坑一边向前走。当遇到无法解决的问题时,就需要不断学习,攻坚克难。

  百度大脑OCR技术与无数像陶新乐一样的开发者并肩同行。作为最早规模化应用的AI技术之一,OCR技术的产业级应用持续取得突破。百度大脑OCR技术可提供多场景、多语种、高精度的文字检测与识别服务,多项ICDAR指标居世界第一,已广泛适用于远程身份认证、财税报销、文档电子化等场景,为企业降本增效,为用户带来更智能化的应用体验。

  当然,AI技术的应用落地,除了需要有百度大脑这样提供领先AI技术能力的平台外,还需要更多像陶新乐这样的开发者们,发挥想象将AI应用在更多真实场景中,满足不同用户群体,甚至是容易被忽视的残障人群的需求,让社会更有“AI”。同时,为了降低独立开发者和企业自主训练OCR文字识别模型的门槛,百度大脑推出业界首个EasyDL OCR自训练平台,提供零门槛、定制化、低成本的一站式OCR模型训练服务。保证高准确率的同时,满足多元化的场景需求,并有效保障数据安全。

  在这个科技为大众生活赋能的时代,产品的设计更是一种普惠理念的输出。已拥有超过800万用户的白描App,已经成为业界的口碑产品。相信,未来还将有越来越多的开发者通过百度大脑AI开放平台提供的AI技术与服务,创造出更多与场景相结合的智能应用,让更多人生活更便捷、更美好。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:互联网

本文评论
传音Spark 8手机新消息:Heli o P22处理器,下周印度发布
ITBEAR科技资讯9月7日消息,朋友们有人知道传音手机的存在吗?在遥远的非洲,它的销量远超华为、小米、OPPO等大众品牌手机。近期传音又出新品手机了,据外媒报道,传音将于下周在印度地区发布自家品牌的Spark8...
日期:09-07
苹果iPhone13系列手机这次真的要涨价了?原因是芯片成本增加
ITBEAR科技资讯9月7日消息,听说iPhone13系列手机要涨价,原因是芯片成本增加!然而手机的核心就是芯片,这个理由足以支撑起新iPhone手机提高售价事情的发生。也因为芯片成本增加的缘故,苹果方面也将有可能...
日期:09-07
帮助高端手机“立好人设”,天玑5G开放架构是怎样做到的?
5G技术的普及加剧了手机市场的竞争,时下高端机型普遍把配置拉得很满,很多配置都是“你有我也有”。然而,高端手机用户的需求并不是千篇一律的,而是希望手机在保持优秀性能的同时,能在一个或多...
日期:09-06
红魔手表活力版预热:支持息屏显示,明日发布
9 月 5 日消息 努比亚出品的红魔游戏手机 6S Pro 将于 9 月 6 日下午 3 点正式发布,今日官方表示将在发布会上同时推出红魔手表活力版。该产品从造型上看与目前在售的红魔手表类似,但重量将更轻。
日期:09-05
realme 9 系列即将到来:realme Pad、8s、8i 将于下周四正式发布
9 月 5 日消息 realme 印度兼欧洲首席营销官 francis wong 透露,realme 9 系列似乎即将到来,他们将会在 9 月 9 日公布具体内容,外媒预计将于 10 月推出。
日期:09-05
爆 AMD 锐龙 6000 系处理器已经量产:首批 6 个型号,明年发布
9 月 5 日消息 根据 VideoCardz 最新消息,名为 @graymon55 的爆料者本月在推特表示,AMD 锐龙 6000 系列处理器已经开始量产,处理器将在中国大陆进行封装,预计将于 2022 年上半年推出,首批共有 6 款产品。...
日期:09-05
高刷屏鼻祖继任者!一加10首度曝光:搭载骁龙898
按照以往惯例,一加每年会在下半年推出升级版的T系列机型,会对上半年旗舰做出一些改进,弥补一些短板配置,今年可能是由于一加 9系列非常全面均衡,消息称一加9 T/9T Pro并没有发布的计划。
日期:09-05
iPhone 13爆料汇总 9月14日发布 5699元起售
随着时间推移,距离“科技春晚”苹果秋季发布会的时间越来越近,关于新机的爆料也是越来越多,今天为大家进行一波爆料汇总,基本上新机信息全在这里了。
日期:09-04
消息称一加 10 手机设计将传承一加 9 系列,增加更多配件
9 月 4 日消息 外媒 MSPoweruser 报道,一加正在为 10 月份的 OnePlus 9 RT 发布会做准备,虽然目前还不完全清楚它是一款高端还是实惠的旗舰手机。现在我们有了一些关于即将在 2022 年亮相的高端 OnePlus 10 ...
日期:09-04
X70/Pro 系列首发采用,vivo 自研 V1 ISP 芯片曝光,大小对比骁龙 888
9 月 4 日消息 9 月 6 日,vivo 举办一场 vivo 影像技术分享会,届时 vivo 自研的「V1 独立 ISP 影像芯片」将会首次亮相。此前,vivo 执行副总裁胡柏山表示,vivo 自研芯片 V1 是一颗专业影像芯片,研发历时 ...
日期:09-04
IPRO 学生手机将于国内上市,家长可远程管理监控
9 月 4 日消息一直面向海外市场的 IPRO 宣布旗下学生手机即将在中国首发上市。IPRO 学生手机在使用过程中,家长可远程管理孩子手机,引导孩子自律并养成良好作息习惯,构建手机绿色网络生态环境。
日期:09-04
realme 8S 定于 9 月 9 日海外发布,全球首发联发科天玑 810 SoC
9 月 3 日消息 今日 realme 印度地区总裁 Madhav Sheth 在推特发布一张预热海报,宣布 realme 8S 定于当地时间 9 月 9 日在印度地区发布,将全球首发搭载联发科天玑 810 5G SoC。
日期:09-03
vivo X70 系列再预热:搭载骁龙 888 Plus 处理器
9 月 3 日消息 vivo 今日下午再次为即将发布的 vivo X70 系列手机预热,该手机作为高端旗舰机型,将搭载高通骁龙 888 Plus 处理器,在 9 月 9 日发布。
日期:09-03
苹果watch 7添新功能了!竟然支持“体温检测”,还能追踪你发烧
  ITBEAR科技资讯9月2日消息,想必新品Apple Watch Series 7智能手表将会在苹果在9月份举行的秋季新品发布会中亮相。随着发布会的日益临近,该款智能手表的爆料也逐渐增多。智能的东西永远更加智能,有消息称该...
日期:09-03
薇娅强烈推荐 三星Galaxy Z Flip3 5G直播间3分钟下单3000台
随着三星Galaxy Z Fold3 5G与Galaxy Z Flip3 5G国行版于9月1日正式登陆国内,新品的预售活动也已同步开启。在9月2日晚,国内“顶流级”电商主播薇娅也第一时间将此次全新的三星Galaxy Z Flip3 5G带进了直播间,面向广大粉丝及消费者开启预售,并且还准备了直播间预售专属福利,包含定制礼包、定制折叠化妆...
日期:09-03
vivo X70 系列预热:搭载 2K E5 屏,9 月 9 日发布
9 月 3 日消息 vivo X70 系列将于 9 月 9 日发布,今天官方再次对新机预热。
日期:09-03
HMD诺基亚即将推出首款国行版5G智能手机!或为诺基亚 G50 5G
ITBEAR科技资讯9月2日消息,诺基亚在今年的手机的手机发布中盈利了不少,其中就包括5G智能机和官翻功能机。今年的诺基亚好像揣着一股劲,据某网友爆料,HMD在近期又有一款新品智能5G手机入网工信部,型号为“TA-1361”。
日期:09-02
红魔游戏手机 6S Pro 外观公布:氘锋透明版 + RGB 特效
9 月 2 日消息 腾讯红魔游戏手机 6S Pro 将于 9 月 6 日 15:00 正式发布,官方此前称该机将搭载“能上天的黑科技,散热,再进化”。
日期:09-02
三星Galaxy Z Fold3/Flip3国行发布:7599元起
  Galaxy Z Fold3还首次实现了与三星王牌功能S Pen的兼容,搭配内屏可以获得优化的多任务体验,比如视频通话同时记录笔记本等。
日期:09-02
啥?苹果iPhone13 Pro手机要砍掉256GB!
ITBEAR科技资讯9月1日消息,昨日苹果iPhone13/Pro手机因支持低轨道卫星通信技术而登上热搜(已经回应,仅支持紧急呼叫功能),在今日,又因iPhone13 Pro取消256GB储存版机型而引发热议,网友们纷纷表示:苹果太“鸡贼”了!
日期:09-01
  专栏介绍
爱萌妮儿 的专栏
爱萌妮儿发表的文章