BERT和ERNIE谁更强？这里有一份4大场景的细致评测

时间：2019-06-17 18:35:11 来源：互联网编辑：星辉 发表评论无障碍通道

BERT和ERNIE，NLP领域近来最受关注的2大模型究竟怎么样?刚刚有人实测比拼了一下，结果在中文语言环境下，结果令人意外又惊喜。具体详情究竟如何?不妨一起围观下这篇技术评测。

1. 写在前面

随着2018年ELMo、BERT等模型的发布，NLP领域终于进入了“大力出奇迹”的时代。采用大规模语料上进行无监督预训练的深层模型，在下游任务数据上微调一下，即可达到很好的效果。曾经需要反复调参、精心设计结构的任务，现在只需简单地使用更大的预训练数据、更深层的模型便可解决。

随后在2019年上半年，百度的开源深度学习平台PaddlePaddle发布了知识增强的预训练模型ERNIE，ERNIE通过海量数据建模词、实体及实体关系。相较于BERT学习原始语言信号，ERNIE直接对先验语义知识单元进行建模，增强了模型语义表示能力。

简单来说，百度ERNIE采用的Masked Language Model是一种带有先验知识Mask机制。可以在下图中看到，如果采用BERT随机mask，则根据后缀“龙江”即可轻易预测出“黑”字。引入了词、实体mask之后，“黑龙江”作为一个整体被mask掉了，因此模型不得不从更长距离的依赖(“冰雪文化名城”)中学习相关性。

除此之外，百度ERNIE还引入了DLM(对话语言模型)任务，通过这种方式来学习相同回复对应的query之间的语义相似性。实验证明DLM的引入对LCQMC(文本相似度计算)系列任务带来了较大的帮助。最终ERNIE采用多源训练数据，利用高性能分布式深度学习平台PaddlePaddle完成预训练。

2. 亲测

到底百度ERNIE模型所引入训练机制有没有起到作用，只有实践了以后才知道。为此，我亲自跑了BERT和ERNIE两个模型，在下面的几个场景中得到了预测结果。

2.1 完形填空

完形填空任务与预训练时ERNIE引入的知识先验Mask LM任务十分相似。从下图的比较中我们可以看到，ERNIE对实体词的建模更加清晰，对实体名词的预测比BERT更准确。例如BERT答案“周家人”融合了相似词语“周润发”和“家人”结果不够清晰;“市关村”不是一个已知实体;“菜菜”的词边界是不完整的。ERNIE的答案则能够准确命中空缺实体。

2.2 NER ( 命名实体识别 )

在同样为token粒度的NER任务中，知识先验Mask LM也带来了显著的效果。对比MSRA-NER数据集上的F1 score表现，ERNIE与BERT分别为93.8%、92.6%。在PaddleNLP的LAC数据集上，ERNIE也取得了更好的成绩，测试集F1为92.0%，比BERT的结果90.3%提升了1.7%。分析二者在MSRA-NER测试数据中二者的预测结果。可以观察到：

1.)ERNIE对实体理解更加准确：“汉白玉”不是实体类型分类错误;

2.)ERNIE对实体边界的建模更加清晰：“美国法律所”词边界不完整，而“北大”、“清华”分别是两个机构。

Case对比：摘自MSRA-NER数据测试集中的三段句子。B_LOC/I_LOC为地点实体的标签，B_ORG/L_ORG为机构实体的标签，O为无实体类别标签。下表分别展现了 ERNIE、BERT模型在每个字上的标注结果。

2.3 相似度

ERNIE在训练中引入的DLM能有效地提升模型对文本相似度的建模能力。因此，我们比较文本相似度任务LCQMC数据集上二者的表现。从下表的预测结果可以看出，ERNIE学习到了中文复杂的语序变化。最终ERNIE与BERT在该任务数据的预测准确率为87.4%、87.0%.

2.4 分类

最后，比较应用最广泛的情感分类任务。经过预训练的ERNIE能够捕捉更加细微的语义区别，这些句子通常含有较委婉的表达方式。下面展示了PaddleNLP情感分类测试集上ERNIE与BERT的打分表现：在句式“不是很…”中含有转折关系，ERNIE能够很好理解这种关系，将结果预测为“消极”。在ChnSentiCorp情感分类测试集上finetune后ERNIE的预测准确率为95.4%，高于BERT的准确率(94.3%)。

从以上数据我们可以看到，ERNIE在大部分任务上都有不俗的表现。尤其是在序列标注、完形填空等词粒度任务上，ERNIE的表现尤为突出，一点都不输给Google的BERT。

【ITBEAR科技资讯】4月13日消息，阿童木(Atomos)今日发布了一款外接支架，名为 Ninja Phone，其售价定为399美元(折合人民币约为2893元)。该款外接支架配备了转码器功能，使得苹果 iPhone 15 Pro / Max 能够作为“专业监屏”连接到相机上。此外，用户还需购买一款售价为5

【ITBEAR科技资讯】4月13日消息，西部数据近期重磅推出了Ultrastar Transporter存储解决方案，其设计初衷即为解决大数据传输难题，内置了高达368TB的固态硬盘，而整个设备的重量则达到了13至15千克。据悉，在网络连接速度受限或传输成本高昂的情况下，Ultrastar Transpo

【ITBEAR科技资讯】4月13日消息，华硕官方近日宣布将参加即将举行的NAB Show 2024活动，并预告将推出一款名为ProArt Display PA32KCX的显示器。据称，这是全球首款8K Mini LED专业显示器，将为专业用户带来前所未有的视觉体验。这款显示器拥有32英寸的超大屏幕，分辨率

【ITBEAR科技资讯】4月13日消息，飞米FIMI于近日在X平台上宣布，其新款无人机飞米MINI 3将于本月15日正式上市。然而，官方并未详细透露这款新品的规格特性，给人留下了一丝神秘感。从官方发布的预告图片中，我们可以捕捉到一些新品的信息。飞米MINI 3预计会采用多彩的机

【ITBEAR科技资讯】4月13日消息，黑鲨科技日前宣布将推出一款全新的智能戒指——“黑鲨魔戒”，近日官方对该产品进行了预热宣传。据官方透露，这款智能戒指拥有令人瞩目的超长续航能力，一次充电可使用长达180天，同时其纤薄的厚度仅为2.2毫米，轻巧便携的设计无疑将为

【ITBEAR科技资讯】4月13日消息，Blackmagic Design今日通过其官方公众号宣布，全新摄影机PYXIS 6K即将在6月正式上市，起售价为26700元。这款PYXIS 6K摄影机以其独特的方形箱式设计引人注目。在硬件配置上，该摄影机装备了高分辨率的CMOS传感器，具体分辨率为6048 x 403

【ITBEAR科技资讯】4月12日消息，映泰公司今日正式发布了旗下第二款基于英特尔锐炫技术的显卡——A750 OC。这款显卡以传统而低调的双风扇设计亮相，为市场带来了新的选择。早在2023年的ComputerX台北电脑展上，映泰便已经展示了一款锐炫A380 ITX显卡，其创新的设计和出

【ITBEAR科技资讯】4月12日消息，华硕IoT物联网部门于4月10日正式发布了全新的边缘AI电脑——PE8000G。这款创新型电脑配备了第13/12代酷睿处理器，并提供了对双450W显卡的支持，从而为用户在边缘计算领域提供强大的实时AI推理能力。华硕IoT PE8000G电脑的设计相当灵活，

【ITBEAR科技资讯】4月12日消息，英特尔正在紧锣密鼓地筹备其下一代Panther Lake系列处理器，并已在官网上推出了一款专为PTL-U芯片设计的测试工具。业界普遍预期，该系列处理器将在2025年正式亮相。Panther Lake不仅是英特尔技术进步的象征，更标志着该公司生产策略的重

【ITBEAR科技资讯】4月12日消息，大疆于昨晚正式推出了DJI Avata 2，这是一款专为第一视角飞行体验设计的无人机，起售价为5988元。为了提供用户一种全新的沉浸式飞行感受，它需要与飞行眼镜、穿越摇杆或FPV遥控器等配件共同使用，让飞行者如同身临其境般自由翱翔。DJI A

【ITBEAR科技资讯】4月11日消息，AMD官网近日正式推出了两款全新的入门级游戏电脑处理器——锐龙7 8700F和锐龙5 8400F。这两款处理器在AM5平台上展现了出色的性能，为全球游戏玩家带来了更多选择。据悉，这两款处理器均采用了先进的Zen 4架构，拥有178mm²的CCD面积，以

【ITBEAR科技资讯】4月11日消息，近日，知名电子阅读器品牌PocketBook推出了全新的InkPad Eo电子阅读器，这款新品采用了10.3英寸彩色电子墨水屏，并定价为569欧元(当前约等于4444元人民币)，吸引了众多消费者的关注。这款PocketBook InkPad Eo电子阅读器的最大亮点在于

【ITBEAR科技资讯】4月11日消息，雷神科技日前宣布，旗下全新“增程式 AI 全能本”aibook 15即将在5月正式亮相。这款笔记本电脑被设计成满足用户多元化需求并有效解决性能上的困扰。从官方发布的预热图中可以看出，雷神aibook 15采用了独特的立轴后出风设计，并且在尾部

【ITBEAR科技资讯】4月11日消息，近日，从产业链内部透露出新的信息，台积电的2纳米和1.4纳米工艺技术已经取得了显著的进步。据产业链内部人士披露，台积电的2纳米和1.4纳米芯片的生产计划已经明确。其中，2纳米工艺的试验性生产预计将在2024年下半年启动，预计在随后的

【ITBEAR科技资讯】4月10日消息，Fairphone公司近日推出了全新的Fairbuds无线耳机，这款耳机凭借其卓越的音质和创新的模块化设计，成为了市场上的一款独特产品。Fairbuds的设计理念注重易维修性，其模块化设计使得用户只需使用一把十字(Phillips #00)螺丝刀和一个撬片，

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
合作咨询QQ：642361(微信同号) 争议稿件处理QQ：42503264
中国（山东）自由贸易试验区 · 齐鲁软件园鲁ICP备11015305号-1
Copyright © 小熊科技资讯 2007-2021 ITBEAR.COM.CN All rights reserved.