端到端识别、增量学习…思必驰DUI标注训练一体化平台的封神级操作

时间：2021-05-19 17:24:32 来源：互联网编辑：星辉 发表评论无障碍通道

坊间总会流传些他们的段子

格子衫、双肩包、沉默且不苟言笑

当然,还有岌岌可危的发量(没有,不是我说的)

那只能说,这些都是表象

堪称新时代的中流砥柱

每天家住回龙观,征战新中关

浑身散发出高级又内敛的气质

究竟是什么塑造的?

(一切为了工作挣钱)

小驰捕捉到一位思必驰程序员小哥哥

今天去看看

他日常的那些“封神级”操作!

Q:一句话形容你正在做的事情?

A:人类之光…在宇宙中心呼唤AI…反正很Cool就对了

Q:最近有什么新成果吗?

A:你光顾着关注我们发际线,不关注我们的精神成果,扣鸡腿…

最近发布了DUI标注训练一体化平台,具体干啥的,来补课!↓↓↓

DUI标注训练一体化平台全场景应用,识别体验持续提升!

https://mp.weixin.qq.com/s/GaVP0XvAgwxrrdFT3fuqRQ

思必驰DUI标注训练一体化平台,让服务赋能走向能力赋能:

https://mp.weixin.qq.com/s/voKIm5uPzSceYmiHdiJWeA

Q:如果我中英文掺着说,语音识别TA能听懂吗?

A:不同场景、环境下的语音识别效果多少会受噪声、专业术语、多语言混合影响。契合场景来提升语音识别率,自然就能准确许多。

Q:让场景识别率能持续提升,你们有什么“神技”傍身?

A:我们融进了最新的「端到端识别技术」来提升识别准确率,通过大规模预训练模型技术提升语音识别后处理效果。结合「增量学习」、「主动学习」、「联邦学习」和「小样本迁移」等技术手段,提升用户体验。同时开放「端点检测模型自训练」、「标点断句自训练」等功能,让用户自己拥有自主权,来解决实际问题。

Q:呃…

A:好,说点你能听懂的

高能,划重点!

第一,关于端到端识别技术。

过往严格意义上的端到端识别技术,如基于LAS的端到端系统,虽然可以较明显地提升通用语音识别的准确率,但受限于计算复杂、自定制语言模型技术不成熟等原因,不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术,在实现通用识别准确率相对提升10%-15% 的同时,也提升了模型计算速度,更可以满足快速有效的语言模型自定制。

第二,关于大规模预训练模型技术。

要知道,语音识别系统中除了核心的语音识别(ASR)模型部分,语音识别的后处理模型也是十分重要的,它直接影响到识别结果的可读性。思必驰语音识别系统支持「智能纠错」、「智能标点断句」、「智能口语顺滑」、「智能语义分段」、「智能语义纠错」等语音识别后处理技术,能进一步提升语音识别的效果与可懂度。模型采用大规模预训练模型,结合多任务学习(Multi-Task Learning)和知识蒸馏(Knowledge Distillation)方法。在降低70%以上模型规模的条件下,提升了模型效果,运算效率大幅提升同时降低了内存开销。

例如在智能会议场景中,通常转写结果是篇章段落,且多含有口语化的表达,通过我们的识别后处理功能,可以将会议转写结果整理成格式化,易读易懂的会议记录。

第三,增量学习。

受限于深度神经网络技术中的灾难性遗忘问题,采用深度学习方法的ASR建模在权衡“既要保障模型原有识别效果,又要提升新的目标场景识别效果”时,通常采用基于新旧数据混合训练的方法。弊端是,该方法增长了模型优化的周期,又会带来数据安全隐患。基于思必驰自研的KDF-IL增量学习方法,在语音识别优化时,可以仅用新增数据进行模型训练,缩短开发周期同时,也有效保障数据安全。 第四,小样本学习。

自研的小样本迁移学习技术,使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句模型进行优化,相对传统模式调优,节省了83%的数据量。例如,在真实的航空质检场景中,通用的标点断句模型面对特殊的专业术语和断句方式,一定会水土不服。得益于小样本迁移学习技术,在使用少量的标注文本情况下,即可实现F值40%左右的绝对值提升,完成体验效果从不可用到可用的转变。最后,咳咳….(这个氛围是不是该升华了)在功能层面,我们深知不同用户的使用场景复杂多样,单靠赋能用户自主训练ASR模型不能满足需求。

我们!(升华来了)秉承以解决用户实际问题为核心的产品理念,开放端点检测模型自训练、标点断句自训练等功能,使得用户可以通过我们的产品,完成识别系统中几乎所有模块功能的自训练,最大程度优化用户体验。

Q:啊,真不愧是“人类之光”。求问,没经验可以用吗?

A:平台建立的出发点就是降低 AI 使用门槛,只要企业有数智化转型的需求,我们就能匹配提供高可用定制的模型。平台的私有化部署能力,也能将自主权交给企业自己,非AI专家都能使用,”零“学习成本。

Q:怎么合作呢?

A:平台同时满足「模块化输出」+「支持 UI可视化界面 /API输出」这两点,可以根据业务需求灵活配置,选择使用一体化平台的全部功能,或者只使用其中几个模块的功能。

Q:可以拓展使用吗?

A:当然可以,「全场景覆盖」是平台的一大优点。适用于各类行业场景,如会议办公、航空通讯、智慧医疗、城市交通、数字化门店、智慧园区、线下质检、政务、庭审等等,可以快速从当前项目复用到新项目中,形成规模化生产定制,满足多样化的业务需求。

Q:怎么联系你们呢?

如有合作意向,请发邮件

Q: 好,不愧是气质不凡的你们!今天收获颇丰!

A:总结下,就是我们在一个科技开放和包容的时代,和一群特别Cool的人,做了些特别Cool的产品和事情。如果你想更了解我们,欢迎随时交流。

【ITBEAR科技资讯】4月13日消息，阿童木(Atomos)今日发布了一款外接支架，名为 Ninja Phone，其售价定为399美元(折合人民币约为2893元)。该款外接支架配备了转码器功能，使得苹果 iPhone 15 Pro / Max 能够作为“专业监屏”连接到相机上。此外，用户还需购买一款售价为5

【ITBEAR科技资讯】4月13日消息，西部数据近期重磅推出了Ultrastar Transporter存储解决方案，其设计初衷即为解决大数据传输难题，内置了高达368TB的固态硬盘，而整个设备的重量则达到了13至15千克。据悉，在网络连接速度受限或传输成本高昂的情况下，Ultrastar Transpo

【ITBEAR科技资讯】4月13日消息，华硕官方近日宣布将参加即将举行的NAB Show 2024活动，并预告将推出一款名为ProArt Display PA32KCX的显示器。据称，这是全球首款8K Mini LED专业显示器，将为专业用户带来前所未有的视觉体验。这款显示器拥有32英寸的超大屏幕，分辨率

【ITBEAR科技资讯】4月13日消息，飞米FIMI于近日在X平台上宣布，其新款无人机飞米MINI 3将于本月15日正式上市。然而，官方并未详细透露这款新品的规格特性，给人留下了一丝神秘感。从官方发布的预告图片中，我们可以捕捉到一些新品的信息。飞米MINI 3预计会采用多彩的机

【ITBEAR科技资讯】4月13日消息，黑鲨科技日前宣布将推出一款全新的智能戒指——“黑鲨魔戒”，近日官方对该产品进行了预热宣传。据官方透露，这款智能戒指拥有令人瞩目的超长续航能力，一次充电可使用长达180天，同时其纤薄的厚度仅为2.2毫米，轻巧便携的设计无疑将为

【ITBEAR科技资讯】4月13日消息，Blackmagic Design今日通过其官方公众号宣布，全新摄影机PYXIS 6K即将在6月正式上市，起售价为26700元。这款PYXIS 6K摄影机以其独特的方形箱式设计引人注目。在硬件配置上，该摄影机装备了高分辨率的CMOS传感器，具体分辨率为6048 x 403

【ITBEAR科技资讯】4月12日消息，映泰公司今日正式发布了旗下第二款基于英特尔锐炫技术的显卡——A750 OC。这款显卡以传统而低调的双风扇设计亮相，为市场带来了新的选择。早在2023年的ComputerX台北电脑展上，映泰便已经展示了一款锐炫A380 ITX显卡，其创新的设计和出

【ITBEAR科技资讯】4月12日消息，华硕IoT物联网部门于4月10日正式发布了全新的边缘AI电脑——PE8000G。这款创新型电脑配备了第13/12代酷睿处理器，并提供了对双450W显卡的支持，从而为用户在边缘计算领域提供强大的实时AI推理能力。华硕IoT PE8000G电脑的设计相当灵活，

【ITBEAR科技资讯】4月12日消息，英特尔正在紧锣密鼓地筹备其下一代Panther Lake系列处理器，并已在官网上推出了一款专为PTL-U芯片设计的测试工具。业界普遍预期，该系列处理器将在2025年正式亮相。Panther Lake不仅是英特尔技术进步的象征，更标志着该公司生产策略的重

【ITBEAR科技资讯】4月12日消息，大疆于昨晚正式推出了DJI Avata 2，这是一款专为第一视角飞行体验设计的无人机，起售价为5988元。为了提供用户一种全新的沉浸式飞行感受，它需要与飞行眼镜、穿越摇杆或FPV遥控器等配件共同使用，让飞行者如同身临其境般自由翱翔。DJI A

【ITBEAR科技资讯】4月11日消息，AMD官网近日正式推出了两款全新的入门级游戏电脑处理器——锐龙7 8700F和锐龙5 8400F。这两款处理器在AM5平台上展现了出色的性能，为全球游戏玩家带来了更多选择。据悉，这两款处理器均采用了先进的Zen 4架构，拥有178mm²的CCD面积，以

【ITBEAR科技资讯】4月11日消息，近日，知名电子阅读器品牌PocketBook推出了全新的InkPad Eo电子阅读器，这款新品采用了10.3英寸彩色电子墨水屏，并定价为569欧元(当前约等于4444元人民币)，吸引了众多消费者的关注。这款PocketBook InkPad Eo电子阅读器的最大亮点在于

【ITBEAR科技资讯】4月11日消息，雷神科技日前宣布，旗下全新“增程式 AI 全能本”aibook 15即将在5月正式亮相。这款笔记本电脑被设计成满足用户多元化需求并有效解决性能上的困扰。从官方发布的预热图中可以看出，雷神aibook 15采用了独特的立轴后出风设计，并且在尾部

【ITBEAR科技资讯】4月11日消息，近日，从产业链内部透露出新的信息，台积电的2纳米和1.4纳米工艺技术已经取得了显著的进步。据产业链内部人士披露，台积电的2纳米和1.4纳米芯片的生产计划已经明确。其中，2纳米工艺的试验性生产预计将在2024年下半年启动，预计在随后的

【ITBEAR科技资讯】4月10日消息，Fairphone公司近日推出了全新的Fairbuds无线耳机，这款耳机凭借其卓越的音质和创新的模块化设计，成为了市场上的一款独特产品。Fairbuds的设计理念注重易维修性，其模块化设计使得用户只需使用一把十字(Phillips #00)螺丝刀和一个撬片，

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
合作咨询QQ：642361(微信同号) 争议稿件处理QQ：42503264
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.