信息无障碍通道
您的位置:首页>>业界动态

LIC 2021颁奖盛典 “千言”数据集推动中文信息处理技术向前迈进

发布时间:2021-08-29 09:38  来源:互联网    背景: 无障碍阅读通道

  8月28日,由中国计算机学会(CCF)和中国中文信息学会(CIPS)共同发起并联合主办的第六届语言与智能高峰论坛召开。会上,2021语言与智能技术竞赛颁奖典礼圆满落幕。

  2021语言与智能技术竞赛由中国计算机学会(CCF)和中国中文信息学会(CIPS)联合主办,百度公司、中国计算机学会自然语言处理专委会和中国中文信息学会评测工作委员会承办。本届竞赛设置了机器阅读理解、多技能对话和多形态信息抽取三大任务,与往届竞赛仅关注模型在单一数据上的效果不同,本届竞赛联手“千言”开源数据集项目,对每项任务设置了更加丰富的数据集合和评测维度,重点关注模型的鲁棒性、泛化性和多任务能力等,从多个维度对技术效果进行综合评价。

  虽然赛题难度较往年有所提升,但开发者们的参赛热度不减。据统计,来自产学研各界4300余人次、3500支队伍参与了赛事争夺,累计收到有效提交结果1万多次,较去年平均单任务提交数提升22%,竞争非常激烈。

  比赛过程中,选手们提出了很多创新思路和方案,三大任务效果相对基线大幅提升20%以上,对话任务甚至达到80%+,有力推动了相关任务的技术进步。在颁奖现场,三个任务的优胜团队也进行了技术方案的分享和交流。

  本次竞赛的机器阅读理解任务从细粒度、多维度挑战了机器理解语言的能力,包括词汇理解、短语理解、语义角色理解等五大考察维度。该赛道冠军——来自深圳平安集团金融壹账通的团队,介绍了行为型微调和注意力机制改良的两阶段微调方案。在行为型微调方案中,针对本次赛题的挑战,分别设计了词汇替换、正/负短语理解问题构造、语义角色互换样本构造和负推理样本构造的方法进行数据增强。并将增强的数据分为低质量和高质量两部分,先用低质量数据对模型做自适应的微调,再用高质量数据作为训练集扩充,从而提高模型的鲁棒性。

深圳平安集团金融壹账通团队方案分享

  多技能对话赛道冠军——来自蚂蚁集团大安全的团队利用了百度开源的对话预训练模型PLATO-2,对多种对话任务进行统一建模,并加入OOV处理、知识筛选、推理优化等优化点,效果大幅提升。同时,该团队也表示,目前业界中文的开源对话数据较少,“千言”数据集的开源开放有助于对话技术的研究发展。

蚂蚁集团大安全团队方案分享

  对于此次参赛的研究成果与自身业务的落地结合,多形态信息抽取赛道获奖队伍之一——来自小米公司的团队也给出了肯定的答案。针对本次赛题,该团队针对关系抽取、句子级事件抽取和篇章级事件抽取分别设计了不同的策略。同时他们表示,大规模知识图谱和事件图谱的构建需要使用准确度高的信息抽取算法,构建好的知识图谱可以应用到广告、对话机器人等场景,对于提高广告CTR和对话机器人回答准确率都有一定的价值。

小米公司团队方案分享

  颁奖典礼现场,百度自然语言处理部主任研发架构师刘璟做了竞赛的整体报告,对本次比赛进行全面总结。他还提到联合建设“千言”数据集开源项目的宗旨:“我们的目标是构建全面的、面向自然语言理解和生成的开源数据集合,希望能够通过多维度的综合评价,以及覆盖丰富的任务类型,共同推动中文信息处理技术的进步”。作为面向自然语言理解和生成任务的中文开源数据集合,“千言”旨在为研究人员带来一站式的数据集浏览、整理、下载和评测的科研体验。在本次比赛结束后,自然语言处理领域的研究者、开发者可通过“千言”官网(luge.ai)继续下载和使用相关数据集,并参与相应的常规评测,不断打磨和提升相关任务的技术水平,形成创新闭环。

  近年来,学术界、产业界对自然语言处理这一领域持续深耕,促进着人工智能学科不断向前发展。自然语言处理技术的应用不仅改变着人类的生活方式,也为实际产业应用的升级提供了更多新的可能。语言与智能竞赛持续“以赛促学”,挖掘和培养更多的AI技术人才、赋能社会百业,为中国AI产业的发展再添动能。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


返回网站首页 本文来源:互联网

本文评论
三星 DeX PC 桌面宣布明年 1 月起停止支持 Windows 7/macOS 系统
11 月 13 日消息,据 SAMMOBILE 报道,三星 DeX 桌面是该公司有史以来最好的生产力软件之一。当连接到更大的显示器(显示器或电视)时,它将你的智能手机或平板电脑软件转化为类似桌面的用户界面 UI。当你把它...
日期:11-13
台积电创始人张忠谋:芯片短缺原因之一是使用方低估需求
11 月 13 日消息,据《经济日报》报道,台积电创始人张忠谋今日在 APEC 经济会议上直言,芯片短缺的原因是使用半导体芯片的一方低估需求,而非制造方。他还表示,自由贸易、自由竞争的市场,是解决芯片短缺或...
日期:11-13
谷歌相机 8.4 版推出:界面微调,闪光灯闪烁倒计时
11 月 13 日消息,据外媒 9to5google 报道,11 月 11 日谷歌相机 Google Camera App 8.4 版本正式推出,为 Pixel 6/Pro 之外的手机带来新功能。
日期:11-13
10月iOS性能榜:124W跑分创新高
M1芯片版本的iPad Pro和A15芯片的iPhone 13系列发布之后,今年的iOS性能榜基本上就可以说已经是尘埃落定了,即使苹果带来了史上最强的M1 Pro和M1 Max,可那又怎么样呢?它又不可能下放到这两个产品线上,所以...
日期:11-13
OPPO 公开安全防护专利,可模拟危险对象的防护对象特征
11 月 13 日消息,昨日,OPPO 广东移动通信有限公司公开了“安全防护方法及装置、介质、电子设备及车辆”专利,公开号为 CN113642111A。
日期:11-13
卢伟冰公开提名天玑2000芯片:Redmi K50系列或配备、性能赶超骁龙898
经历过双11大战之后,各家手机厂商业都迅速回到了正轨,目前已知有多家厂商都已经开始准备新品发布会,推出各档位新手机了。
日期:11-13
小米公开商品购买意图确定专利,可精准定位潜在目标用户
11 月 13 日消息,昨日,北京小米松果电子有限公司、北京小米移动软件有限公司公开了“商品购买意图确定方法、装置、存储介质及电子设备”专利,公开号为 CN113643068A。
日期:11-13
苹果被曝秘密为少数高价值第三方应用购买谷歌搜索广告
11 月 13 日消息,据外媒报道,多家应用发行商爆料称,苹果正在秘密为少数第三方高价值应用购买谷歌搜索广告,借此引导用户浏览苹果应用商店列表而非开发商自己的网站。此举可能损害开发商利益,导致他们损失...
日期:11-13
SK 海力士获得 ISO 26262 汽车半导体芯片安全认证
11 月 12 日消息,根据外媒 techpowerup 报道,韩国企业 SK 海力士于 11 月 11 日获得了 ISO 26262: 2018 FSM 汽车半导体芯片安全认证。这一认证由全球汽车功能安全认证机构 TUV Nord 颁布,两家公司举办了证...
日期:11-12
OPPO Reno 7 通过工信部认证,有望在近期发布
11 月 12 日消息,OPPO Reno 7 以及 7 Pro 新机通过 3C 认证,型号为 PFDM00 和 PFJM10,采用 65W 快充。
日期:11-12
全球首款 4nm 手机芯片:联发科天玑 2000 平台 vivo 新机曝光,安兔兔跑分突破一百万
11 月 12 日消息,联发科方面近日开始预告,全新的旗舰芯片组天玑 2000 SoC 即将到来,基于 4nm 工艺,也是全球首款 4nm 的手机芯片,或成为台积电 4nm 首发新品。
日期:11-12
消息称联电计划 2022 年一季度将代工报价再度上调 10%
11 月 12 日消息,IC 设计业内消息人士称,联电计划从 2022 年第一季度起,将代工报价再度上调 10%,新报价将适用于其前三大客户的订单,过去的一年,上述客户由于提前锁定长单,而免于联电的多次涨价。
日期:11-12
Unity 与 LG U + 签署合作意向书,将打造办公区元宇宙
11 月 12 日消息,Unity 韩国近日宣布与 LG U+ 达成商业协议(MOU),就元宇宙技术展开合作。
日期:11-12
英特尔与中科院计算所宣布结成战略合作伙伴,共建中国首个 oneAPI 卓越中心
11 月 12 日消息,第三届中国超级算力大会(ChinaSC 2021)今日以“线上 + 线下”形式在京召开。会上,中国计算机学会高性能计算专业委员会(以下简称 CCF 高专委)还发布了 2021 中国高性能计算机性能...
日期:11-12
消息称三星电机将供货苹果 M1 芯片用 FC-BGA 封装基板
11 月 12 日消息,据 TheElec 报道,自去年以来,三星电机一直在向苹果公司提供倒装芯片球栅阵列(FC-BGA)封装,供其在 M1 芯片上使用。
日期:11-12
台积电加速全球扩张,可能将削弱其高毛利优势
全球最大的芯片制造商台积电正在加速全球扩张。
  11 月 11 日,索尼半导体解决方案和台积电联合宣布,台积电将在日本熊本县设立子公司日本先进半导体制造公司,将提供 22nm 和 28nm 工艺的初始技术。...
日期:11-12
不再谷歌 Pixel 系列独享,其它厂商手机有望用上 Android 12 动态颜色主题功能
11 月 12 日消息,XDA 论坛主编 Mishaal Rahman 今日在 Twitter 上发推称,Monet(原生 Android 12 里的壁纸主题系统)的源代码将会伴随新系统 Android 12L 一起发布,但基于 Material 组成库(Material Compone...
日期:11-12
支持 5G:华为 Mate X2 折叠屏旗舰手机开放购买
今年 2 月,华为正式发布了 Mate X2 全新折叠屏手机。搭载 8GB 内存,256GB 售价 17999 元,512GB 售价 18999 元。
日期:11-12
英特尔 12 代酷睿 65W 型号参数规格曝光:i9-12900 16 核 24 线程,最高 5.1GHz
11 月 12 日消息,英特尔现已推出了 12 代酷睿 125W K 系列可超频处理器,65W 的不可超频系列暂未发布。爆料者 Momomo_US 现在曝光了 12 代酷睿 65W 型号的参数规格,共六款。
日期:11-12
SK海力士首秀HBM3内存:轻松堆叠288GB
SK海力士日前宣布,已经全球首家研发成功新一代HBM3内存,单颗容量16/24GB,内部堆叠多达12颗芯片,而厚度只相当于A4纸的三分之一,带宽则高达819GB/s,还支持ECC。
日期:11-12
  专栏介绍
数码圈 的专栏
数码圈发表的文章