滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

今日头条是如何反低俗的？首次揭秘灵犬背后的技术原理

时间：2019-08-02 09:27:19 来源：北国网编辑：星辉 IP：北京 发表评论无障碍通道

7月30日，今日头条宣布正式推出灵犬反低俗助手(以下简称“灵犬”)3.0版本，同时支持对图片和文本的低俗低质内容检测。用户可以通过“灵犬”检测文本、图片等类型的内容健康指数，共同参与打击低俗低质内容，净化网络空间。

当天下午，一场名为“算法如何反低俗”的沟通会在字节跳动总部举办。字节跳动人工智能实验室总监王长虎进行了主题分享，首次向外界公开“灵犬”背后的技术原理。

图注：字节跳动人工智能实验室总监王长虎分享“灵犬”背后的技术原理

“灵犬”文本和图片识别能力的背后，离不开今日头条反低俗模型的技术支持。据了解，2012年以来，今日头条内部搭建了反低俗、反标题党、反虚假信息、反低质等数百个模型，并投入近万人专业审核团队。

当天发布的“灵犬”3.0版本重点拓展了反低俗识别类型和模型能力，现已覆盖文本识别(反低俗、反暴力谩骂、反标题党)和图片识别(反低俗、反血腥暴力)。

据了解，在文本识别领域，新版“灵犬”同时应用了“Bert”和半监督技术，训练数据集包含920万个样本，准确率提升至91%;在图片识别领域，“灵犬”采用深度学习作为解决方案，在数据、模型、计算力等方面均做了针对性优化;

王长虎介绍，“灵犬”背后的文本分类模型，已经经过了三次迭代。最新版“灵犬”同时应用了“Bert”和半监督技术，并在此基础上使用了专门的中文语料，并通过优化模型结构使得计算效率能达到实用水平。“Bert”是当前最先进的自然语言处理技术，在阅读理解、语义蕴含、问答、相关性等任务上性能大幅提升。

不同于文本识别，图片识别的技术难点主要在于三方面：非均衡、类内方差大和不可穷举，即，低俗图片占整体图片内容的比例较低，低俗图片的种类丰富、繁杂，构成低俗图片的特征千差万别。

对此，“灵犬”运用的解决方案，是深度学习。“我们分别在数据、模型、计算力等方面做了很多优化。”王长虎说。数据层面，“灵犬”已累积上千万级别的训练数据。模型层面，“灵犬”针对许多困难样本做了模型结构调优，尝试解决多尺寸、多尺度、小目标等复杂问题。计算力层面，“灵犬”利用分布式训练算法以及GPU训练集群，加速模型的训练和调试。

同时，王长虎也提到，反低俗无法单一地依靠技术去解决。低俗的定义和标准随着人群、使用场景、时代等因素变化皆会发生变化。针对低俗判断问题的复杂性和不同判断方式的局限性，王长虎提到，一方面要不断进化技术模型，一方面需要有效结合技术和人工判断两种方式。

“作为行业领先者，在内容安全上，今日头条一直用最高的标准要求自己，”王长虎说，“灵犬是一个开放的反低俗窗口，我们希望通过灵犬，接收社会各界对反低俗的意见和建议。”

举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

石头科技7月18日融券净卖出超千股，融资融券余额略降至7.38亿元

融券方面，当日融券卖出1411.0股，融券偿还284.0股，融券净卖出1127.0股，融券余量3.7万股，近20个交易日中有13个交易日出现融券净卖出。包括券商对投资者的融资、融券和金融机构对券商的融资、融…

07-21

百度广告收入下半年或承压，花旗下调利润预期，无人驾驶业务持续增长

花旗分析师在报告中表示，在百度快速提升AI搜索能力和广告支出情绪持续低迷的情况下，广告收入对业绩的拖累可能超出预期。百度2025年一季度核心收入为255亿元，同比增长7%。今年一季度，萝卜快跑在全球提供超1…

07-21

AI版权风波：作家集体状告Anthropic，盗版书籍训练模型引争议

07-21

济南轨道交通集团联手建投等，新设90亿资本管理公司，布局何方？

07-21

司马南未道歉，南开大学教师事件引发公告风波

07-21

碧桂园地产集团等遭强制执行，金额高达3.3亿！

07-21

赵丽颖维权成功，获赔五万元！

07-21

高温来袭！乐山大佛“避暑”，全国4400余家防晒企业如何应对？

07-21

“大人”真的不爱零食吗？揭秘我国570余万家零食企业的背后真相

07-21

AI Gist：开源提示词管理工具，助力开发者高效管理多语言AI项目

07-21

中广核辽宁新能源公司盛大启航，注册资本高达3亿元

07-21

宝剑嫂雨哥分手，粉丝走向两极分化？

07-21

迪丽热巴维权成功，获赔两万彰显法律正义

07-21

保利国际大手笔增资，注册资本跃升至10亿，增幅高达9倍！

07-21

太平鸟集团资本大动作！注册资本增至10亿，增幅高达233%

07-21

点击查看更多 +

全站最新

小米汽车与特斯拉“神似”照片引热议，摄影师澄清拍摄经过

电动车贬值榜：特斯拉领跌，二手市场电车价值缩水明显

奔驰应对豪车税调整：限时全额承担新增消费税，力保销量稳定

特斯拉马斯克预告：即将上演“史诗级”新品演示，引发热烈猜想

智界R9全尺寸豪华SUV谍照抢先看，11月正式发布面临市场考验

京东战略加持，逐际动力推进人形机器人量产与生态协同

热门内容

本栏最新

石头科技7月18日融券净卖出超千股，融资融券余额略降至7.38亿元

百度广告收入下半年或承压，花旗下调利润预期，无人驾驶业务持续增长

济南轨道交通集团联手建投等，新设90亿资本管理公司，布局何方？

司马南未道歉，南开大学教师事件引发公告风波

碧桂园地产集团等遭强制执行，金额高达3.3亿！

赵丽颖维权成功，获赔五万元！

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 商业合作入口
Copyright © 小熊科技资讯 2007-2024 ITBEAR.COM.CN All rights reserved.

今日头条是如何反低俗的？ 首次揭秘灵犬背后的技术原理

今日头条是如何反低俗的？首次揭秘灵犬背后的技术原理