基于深度学习的出生缺陷关系抽取及知识图谱的构建.pdfVIP

基于深度学习的出生缺陷关系抽取及知识图谱的构建.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华东师范大学硕士学位毕业论文 摘要 出生缺陷是指胎儿在形成发育时期形成的机体结构、代谢或功能异常等,它 严重影响着出生人口质量和儿童的生命健康,使得患儿的生活质量得不到保障。 此外,它还给患者家庭带来了沉重的精神和经济压力。目前国内关于出生缺陷的 相关统计信息较少,缺乏对出生缺陷疾病相关信息系统性地整合,这对出生缺陷 的防预和治疗非常不利。 针对这个问题,本研究基于共现的方法,从PubMed历年文献中筛选出生缺 陷与表型/症状、基因、致畸物/药物等共同出现的句子。首先,本文对这些句子 进行了假阳性处理,根据远程监督的思想,利用UMLS定义的关系,人工给句子 中两个实体标注关系,从而建立起出生缺陷相关的语料库。然后,利用人工标注 好的语料库训练了三种不同的深度学习关系抽取模型,分别为Bi-LSTM + Attention 、PCNN + Attention和BERT + Softmax模型。本文依据这三种模型的预 测结果,采用多数表决和高置信度的方法,生成最终的关系抽取预测模型以得到 实体,关系,实体三元组。接下来将三元组相关信息存储在图数据库Neo4j中, 构建了出生缺陷领域的知识图谱。最后,利用训练好的预测模型对新句子进行预 测从而推断出句子中实体之间的关系,并将新得到的三元组添加到知识图谱中。 另外,在模型训练开始前,本文还利用Word2vec算法训练了生物医学领域的词向 量,其可以直接用于后续的各种生物医学领域的自然语言处理任务。 本文还构建了知识图谱自动更新系统,系统能够定期自动地从PubMed 上爬 取最新的文献数据并存储在本地服务器上,利用训练好的关系抽取模型从这些医 学文本数据中获取关系三元组,并存储至本地 Neo4j 图数据库中进行可视化处 理。出生缺陷知识图谱提供了基于 Cypher 语言的查询功能,可以进行实体和关 系查询,并将结果以图形化方式展现给用户。该研究结果一定程度上为学者和医 生等的研究工作提供了便利,对出生缺陷的防预和治疗也起到了积极的作用。 关键词:出生缺陷、卷积神经网络、BERT 、长短期记忆网络、实体关系抽取、 知识图谱 1 华东师范大学硕士学位毕业论文 ABSTRACT Birth defects refer to the abnormal body structure, metabolism or function of the fetus that occurs during its formation and development period. It affects the quality of the birth population and the health of children seriously, so that the quality of life of children can’t be guaranteed. In addition, it also brings heavy mental and financial burdens to the patients family. At present, there are relatively few statistical information about birth defects in China, and there is a lack of systematic integration of information related to them, which is very unfavorable for the prevention and treatment of birth defects. To solve this problem, based on the method of co-occurrence, this research selects the sentences that contain both the birth

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档