基于深度学习的命名实体识别研究.pdfVIP

下载本文档

0
0
约7.66万字
约 53页
2024-07-25 发布于广东
举报
版权申诉

基于深度学习的命名实体识别研究.pdf

1、本文档共53页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

基于深度学习的命名实体识别研究

随着信息时代的发展，互联网带给人们生活便利的同时，也产生了海量的数

据。在数据爆发式增长的趋势下，如何处理海量的非结构化数据，抽取有效信息

成了当下最为重要的问题。而命名实体识别技术可以从海量文本数据中提取关键

实体信息。因此，命名实体识别任务起着至关重要的作用，具有极高的应用价值

与研究意义。

近年来，随着计算机硬件条件的提升，GPU的发展十分迅猛。在充足的算力

面前，深度学习的应用越来越广泛。在没有计算能力的限制下，深度学习的效果

越来越好。面对海量的文本数据，深度学习技术可以从中自动提取有效特征信息，

避免了人工提取特征。本文利用深度学习方法开展命名实体识别任务，主要工作

与贡献体现在下述三个方面：

第一，标注中文命名实体识别数据集。本文实验数据来源于《人民日报》标

注语料库（PFR）和微软亚研院（MSRA）命名实体识别语料。两种数据集均为

已经标注好词性的语料，如：人名、地名、组织机构名标注为nr、ns、nt。本文

将数据集的词性转换为BIO标签，采用BIO和BIOES两种标注形式对两种不同

的数据集进行命名实体识别任务研究。

第二，构建了IDCNN-CRF命名实体识别模型。在命名实体识别领域，卷积

神经网络用来捕获文本的局部信息。除此之外，随着卷积神经网络层数的加深，

网络参数以指数级别加深。针对此问题，本文构建了一种基于膨胀卷积神经网络

（IDCNN）的命名实体识别模型。由于IDCNN没有池化层，该模型避免了卷积

时上下采样导致的数据丢失，同时增大了感受野，以提取更加广阔的全局特征，

有效的解决了长距离句子的上下文依赖关系。接入CRF，利用CRF中的状态转

移矩阵，对文本输出序列的概率规则进行学习，计算得到最佳的输出序列标签。

本文采用不同的参数对IDCNN-CRF模型做了大量的实验，确定了一组最优的实

验参数配置。在两种不同的数据集中取得的F1值比基线模型CRF得到的F1值

分别提升了10.4%和11.41%，比LSTM-CRF模型分别提升了5.16%和8.34%。

与BiLSTM-CRF模型相比，效果提升了0.38%和2.07%，并且在训练时间上缩短

了近30%，明显提高了运行效率。

第三，构建了基于BERT-BiLSTM-CRF的命名实体识别模型。BiLSTM网络

可以提取上下文信息，但是不能对多义字进行表征，针对此问题，本文在BiLSTM-

CRF的基础上，引入了BERT预训练词向量。具有双向Transformer编码的BERT

词向量通过Mask语言模型有效的解决了多义字表征问题，能够提取词级别和句

子级别的特征信息，极大的增强了句子的语义表示能力。本文用BERT预训练词

向量替代了传统词向量表示，为CRF提供了强健的语义表示信息。在《人民日

报》数据集和MSRA数据集的中文命名实体识别任务中，与基线模型CRF相比，

BERT-BiLSTM-CRF模型取得的F1值提升了15.31%和16.04%。与LSTM-CRF

模型相比，提升了10.07%和12.97%。BERT-BiLSTM-CRF模型的F1值比BiLSTM-

CRF模型高出5.29%和6.7%，比IDCNN-CRF模型高出4.91%和4.63%。

关键词：命名实体识别，深度学习，膨胀卷积神经网络，条件随机场，BERT

Abstract

ResearchonNamedEntityRecognitionBasedonDeepLearning

Withthedevelopmentoftheinformationage,theInternetnotonlybrings

conveniencetopeopleslife,butalsoproducesahugeamountofdata.Underthetrend

ofdataexplosivegrowth,howtodealwithmassivenon-structuraldataandextract

effectiveinformationintothecurrent

您可能关注的文档

文档评论（0）

论文资源 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于深度学习的命名实体识别研究.pdfVIP