微软运用人工智能技术实现多语言实时语音翻译

时间：2016-12-15 09:56:48 来源：腾讯科技作者：纪振宇编辑：星辉 发表评论无障碍通道

拿起手机，打开应用，按下麦克风图标的按钮，然后对着麦克风位置说话。

这样的应用场景是否让你似曾相识?只不过微软将这样的使用场景用在了实时语音翻译上。

借助智能手机，微软开发的新一代翻译工具，能够实现实时的语音翻译。13日，微软发布了最新一代翻译工具(Microsoft Translator)，目前可以实现包括中文在内的9种语言的实时语音转为文本翻译。

微软翻译产品营销总监Olivier Fontana 14日对腾讯科技表示，微软认为，现在几乎人人都拥有的智能手机，为实时语音翻译提供了良好的硬件条件。

微软翻译产品营销总监Olivier Fontana展示微软新一代翻译工具

此次微软发布的翻译工具最大的亮点在于，通过底层的深度神经网络技术的应用，能够实现更准确的语音识别和翻译。

Fontana介绍说，该工具的语音识别部分和翻译部分分别采用了ResNet深度神经网络和LSTM(长期短期记忆)技术，其中ResNet神经网络深度达到了150层。

在用户界面方面，微软采用了类似微信“面对面建群”的方式：参与到对话中的所有人都在一个群组中，任何人对着群组说自己的语言，其他群组成员就能在群组的聊天界面中实时看到翻译成自己所使用的语言的文字。

以创建和加入群组的方式进行实时语音翻译

为了试验该翻译工具的具体功能，Fontana 与我以及另一位公关人员就使用该工具的群组语音实时翻译功能，进行了一场三种语言的交互对话，我们各自用中文、法语和英语对着应用说话，我们各自手机的群组中则自动呈现中各自能够识别的语言文字。

就我个人的体验感受来说，整个过程非常简单易用，界面简洁直观，发起对话的人只要新建群组，就随机自动生成一个群组代号以及二维码，其他参与到该群组中的人只需扫描二维码或者输入群组代号，并且选择自己的语言，就能即刻加入到对话当中。

对于语音的识别以及翻译过程，也十分流畅，在我们三人简单通过该工具用各自语言进行对话的过程中，并没有出现太多的影响对话节奏的延迟问题。

当然，语音的识别和翻译的准确率依然存在一定的瑕疵，比如当我用更为口语化的中文语言进行对话时，翻译的质量便并不是特别好，只有当我使用简洁、逻辑清晰的语言时，翻译出的文本质量才让我比较满意。

翻译结果以用户熟悉而亲切的聊天界面方式呈现

Fontana介绍说，这一工具能够在很多实际的场景下得到应用，例如国际旅游团的导游向使用不同语言的各国游客介绍景点，在陌生的国度乘车时与司机进行实时对话，参加使用不同语言的国际性会议等。

目前该翻译工具支持苹果iOS、安卓、Windows等系统，除了手机端，也能够在个人电脑上通过网页创建或加入群组对话。

Fontana介绍说，该翻译工具使用了深度神经网络技术，在使用过程中的语音数据也会上传至云端供神经网络的训练使用，他强调了所有上传到云端的语音都是匿名的，以保护使用者的隐私。

此外，微软在该产品的开发过程中，还特别注意到了一些其他特殊场景的应用所需考虑到的细节，例如在教室中使用，系统会自动只让创建群组的教师的声音能够被录入，而学生的声音不被录入，因为美国法律规定在不被允许的前提下，不能让学生的声音被采集。另外，该翻译工具还能自动屏蔽污言秽语，这些文字会以*号呈现，翻译的语音则由“哔”音或其他用户自定义的声音代替。

目前，越来越多的人工智能技术被运用到翻译应用中。前不久谷歌(微博)翻译团队发布的全新的翻译工具，同样也运用了LSTM技术，无论是翻译的准确度还是质量相较过去的基于词组和短句的翻译方式，都得到了显著的提高。

【ITBEAR科技资讯】4月13日消息，近日，华为常务董事余承东与小米创始人雷军就手机支架的必要性展开了一场热烈的讨论，这场讨论也引发了网友的广泛关注。余承东在华为智界S7的发布会上表示，他最初对于车载手机支架的存在感到困惑，认为这是因为车载导航系统的功能不足

【ITBEAR科技资讯】4月12日消息，华为技术有限公司最近成功申请了一项重要的通信专利，该技术能有效保证信道占用时间的连续性，避免因跨信道占用时间而引发的数据丢失问题。据悉，此专利覆盖了一种全新的通信方法、装置、计算机可读存储介质以及程序产品。其核心技术在

【ITBEAR科技资讯】4月12日消息，前日夜间，大疆公司全新推出的Avata 2无人机正式亮相，为消费者提供了裸机及两种不同配置的电池套装选择。具体价格及配置如下：裸机版售价为2988元;单电池畅飞套装，内含飞行眼镜3、穿越摇杆3以及1块飞行电池，售价为5988元;而三电池畅

【ITBEAR科技资讯】4月11日消息，索尼官方今日正式公布，备受瞩目的2024年索尼电视及家庭影院新品发布会将于4月18日隆重举行。全球发布会将在零点准时开启，而中国区的发布会(直播)则定于晚20:00与大家见面。今年的发布会口号与去年“为娱乐而生”的主题有所不同，索尼

【ITBEAR科技资讯】4月11日消息，据相关媒体报道，阿里巴巴创始人马云今日在阿里内网发布了一篇名为《致改革致创新》的长文，对阿里巴巴过去一年的改革创新成果给予了高度评价。这也是马云自五年前退休以来的首次长篇分享，详细阐述了他对公司改革创新及展望未来的观点

【ITBEAR科技资讯】4月11日消息，近日有报道称，苹果的重要代工厂富士康或将迎来管理层的大调整。据悉，富士康正在积极探讨引入轮值CEO制度的可行性，此举被视为公司管理层改组的重磅策略，意在长远地培育公司领导人才。尽管轮值CEO制度在全球范围内并不十分普及，但行

作为家电领域德系匠心的代表，成立于1899年的美诺Miele，至今已走过125年的漫漫征途。百余年间，秉承“匠心品质，超越时代”这一刻入品牌DNA的精神，美诺不断突破自我，诠释卓越，以品质佳作，书写家电发展历史。“爱一事，终一生”，匠人精神无问东西。值此125周年之际

【ITBEAR科技资讯】4月10日消息，今日下午，字节跳动官方账号发布声明，针对媒体关于公司利润增长及数据的传言进行辟谣，明确表示相关报道不实。早前，有外媒报道称字节跳动在2023年的利润飙升约60%，甚至超过了腾讯控股和阿里巴巴集团控股的增长速度。这一消息似乎表明

【ITBEAR科技资讯】4月10日消息，近日，腾讯音乐娱乐集团(TME)与长城汽车联合举办了一场研讨会，并正式宣布启动战略合作。在这次合作中，腾讯音乐为长城汽车颁发了“AI 座舱先锋合作伙伴”证书，双方将共同致力于智能座舱中AI音频技术的研发与应用，通过TME旗下产品为车

【ITBEAR科技资讯】4月10日消息，近日，有知情人士透露，字节跳动在2023年的利润实现了惊人的增长，飙升约60%，这一数字不仅超越了腾讯控股和阿里巴巴集团控股的增长，更彰显了TikTok所有者在经济低迷时期的强大韧性。据悉，这家全球估值最高的初创公司，在过去一年中销

【ITBEAR科技资讯】4月10日消息，近日，台积电公布了其2024年三月份的营收情况以及一至三月的累计营收数据。据数据显示，三月份台积电实现了1952.11亿元新台币的营收，环比增长7.5%，同比增长更是高达34.3%。而在一至三月的累计营收方面，台积电累计实现了5926.44亿元新

【ITBEAR科技资讯】4月10日消息，LG电子近日宣布，已与企业工会就本年度薪水和福利待遇调整达成了一致意见，并在内部发布了相关公告。据悉，今年的平均工资涨幅定为5.2%，相比去年的6%略有下滑。这一调整方案不仅涉及到基础薪资的增长，还包括了追溯调整3月份的工资。对

【ITBEAR科技资讯】4月10日消息，美的集团与蔚来汽车在安庆的威灵汽车部件工厂达成了一项重要战略合作。两大行业巨头将在新能源汽车零部件、自动化技术服务、数字化建设等多个领域携手并进，共同探索低碳可持续园区及智慧物流的新路径。此次签约仪式得到了双方高层的高

【ITBEAR科技资讯】4月10日消息，金山办公在近期发布了一站式AI办公平台WPS 365，该平台全面覆盖了企业日常办公的基本需求，从文档创作到即时通讯、会议、邮件，再到AI应用，标志着文档处理套件正式升级为一站式AI办公。此次发布会上，金山办公推出了面向企业和组织的WP

【ITBEAR科技资讯】4月10日消息，近日有消息人士透露，京东近期在内部进行了多次讨论，重点探讨如何进军短视频领域。据称，京东高层已就此议题组织了多次小范围讨论，并最终达成共识，计划对短视频领域进行重大投入，其中包括高达10亿量级的现金补贴。此举意在顺应当前

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
合作咨询QQ：642361(微信同号) 争议稿件处理QQ：42503264
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.