数字人文视角下魏晋南北朝时期人名自动识别研究.pdfVIP

数字人文视角下魏晋南北朝时期人名自动识别研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

目录

目录

目录i

图目录v

表目录vii

摘要Ⅰ

ABSTRACTⅢ

第一章绪论1

1.1研究背景1

1.2研究意义2

1.3研究目的3

1.4研究内容3

1.4.1古文语料的获取和预处理3

1.4.2古文语料上命名实体识别的研究3

1.5本文组织结构4

1.6创新之处4

第二章国内外研究与发展现状7

2.1知识库构建7

2.2数字人文研究概况8

2.3命名实体识别概述10

2.3.1基于规则和词典的识别方法11

2.3.2基于统计机器学习的方法12

2.3.3基于深度学习的方法13

2.4面向数字人文的古汉语信息处理研究15

2.5基于魏晋南北朝历史古籍的研究现状16

2.6本章小结18

第三章魏晋南北朝历史人名标注数据集的构建19

3.1数据源简介19

3.2人名知识库构建的重要性21

3.3数据库构建流程22

3.3.1标注相关概念23

i

数字人文视角下魏晋南北朝时期人名自动识别研究

3.3.2标注数据处理24

3.3.3标注规则25

3.3.4标注数据集的构建25

3.4本章小结27

第四章魏晋南北朝历史人名特征分析29

4.1历史人物姓名概述29

4.2人名样本库29

4.2.1单名用字表30

4.2.2双名用字表31

4.2.3三字及以上姓名排序表32

4.2.4名字用字特征分析35

4.3姓氏用字特征分析35

4.4人名上下文特征37

4.4.1人名上文一元词特征分析39

4.4.2人名下文一元词特征分析42

4.5本章小结42

第五章魏晋南北朝时期人名实体识别设计与实现45

5.1问题描述45

5.2模型介绍45

5.2.1CRF模型45

5.2.2BERT预训练模型46

5.2.3Bi-LSTM-CRF模型48

5.2.4SikuBERT和SikuRoBERTa模型49

5.3实验分析50

5.3.1数据预处理50

5.3.2实验环境50

5.3.3测试方法与评价指标50

5.4实验及结果分析52

5.4.1CRF模型实验及结果52

5.4.2Bi-LSTM-CRF模型实验及结果53

5.4.3BERT、SikuBERT和SikuRoBERTa模型实验及结果54

5.4.5对比分析56

5.5模型自动识别错误分析56

ii

目录

5.5.1强标注导致特征转移56

5.5.2人工标注歧义57

5.5.3具有多个含义的单词的判断错误57

5.5.4数据分布不均57

5.5.5复杂的逻辑关系58

5.6本章小结58

第六章总结及展望59

6.1总结59

6.2展望60

参考文献63

致谢67

您可能关注的文档

文档评论(0)

营销资料库 + 关注
实名认证
文档贡献者

本账号发布文档部分来源于互联网,仅用于技术分享交流用,版权为原作者所有。 2,文档内容部分来自网络意见,与本账号立场无关。

1亿VIP精品文档

相关文档