- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
面向心脏病知识图谱的属性抽取方法研究
摘要
心脏病是一种涉及心脏或血管的疾病,其高发病率与死亡率备受社会关注,是全球
主要的健康挑战之一。心脏病诊断检查的准确性和治疗的及时性,对维护患者的健康水
平至关重要。然而,诊断检查与治疗的相关信息通常以非结构化的形式存在,给信息的
管理应用以及诊疗的时效性带来了挑战。因此,建立一个以图形化方式呈现各属性之间
关系的心脏病知识图谱具有重要研究价值,且构建知识图谱步骤之一的属性抽取任务可
从非结构化文本中抽取出与实体相关的属性值,也相对重要。目前针对心脏病领域属性
抽取问题的研究相对有限,本文提出一种基于预训练语言模型融合多特征信息的属性抽
取方法,以实现对心脏病领域属性抽取问题的解决以及在心脏病知识图谱上的应用。本
文的主要工作可分为以下几个方面。
针对心脏病领域文本信息的复杂冗余,提出基于预训练语言模型融合多特征信息的
属性抽取方法,该特点为将文本字词特征信息及上下文特征信息两部分融合后进行学习,
从而弥补部分模型学习不充分的缺陷。在三个中文数据集上的实验结果显示,相较各自
最优的对比方法,该方法的F1值分别提升了0.67%,0.73%,1.11%。此外,消融实验
验证了该方法中词汇增强模块与双向长短期记忆网络模块在属性抽取任务中的有效性。
针对没有开源心脏病属性抽取数据集,经过对医院心脏病病案的筛选及数据清洗,
人工标注后构建一个专用于心脏病领域的属性抽取数据集,从而更好适用于心脏病领域
属性抽取任务。该数据集有心脏病领域九种常见属性,包含疾病名称属性、损伤属性、
症状属性、体征属性、检查程序属性、治疗或预防措施属性、科室属性、药物属性、检
查或治疗设备属性,为后续心脏病属性抽取模型提供了充足且多样化的数据样本。
使用属性抽取技术在心脏病知识图谱上进行应用,相较于属性抽取任务的通用模型,
本文提出的方法在医学预训练语言模型模块与医学词汇增强模块共同作用下,在构建的
心脏病病案数据集上的F1值、精确率和召回率上均得到了明显的提升,证明该方法在
预训练语言模型提供的医学语义特征与词汇增强层提供的医学词汇特征的共同促进下,
具有有效性。进而将该方法应用在中国知网中心脏病相关文献进行属性抽取,实验识别
出的信息可为心脏病知识图谱的构建提供更多样化的属性值,在心脏病知识图谱的应用
情况再次证明了该方法具有有效性。
关键词:心脏病;知识图谱;属性抽取;多特征融合
面向心脏病知识图谱的属性抽取方法研究
ABSTRACT
Heartdiseaseisadiseaseinvolvingtheheartorbloodvessels,anditshighmorbidity
andmortalityratesareofgreatconcerntosocietyandoneofthemajorglobalhealth
challenges.Theaccuracyofdiagnostictestsandthetimelinessoftreatmentforheartdisease
arecrucialformaintainingthehealthlevelofpatients.However,informationrelatedto
diagnostictestsandtreatmentsusuallyexistsinanunstructuredform,whichposesachallenge
tothemanagementapplicationoftheinformationaswellasthetimelinessofdiagnosisand
treatment.Therefore,itisofsignificantresearchvaluetobuildaknowledgegraphofheart
diseasethatgraphicallypresentstherelationshipsbetweenattributes,a
您可能关注的文档
最近下载
- T∕CACM 1066.2-2018 中医治未病标准化工作指南 第2部分:标准体系.docx VIP
- 技术服务措施及保障措施方案.docx VIP
- 新媒体环境下的微博营销【文献综述】.doc VIP
- 2021钻床工考试-初级钻床工考试(精选试题).doc VIP
- 化工企业双重预防机制.pdf VIP
- (铁总计统〔2017〕177号 )中国铁路总公司关于进一步加强铁路建设项目征地拆迁工作和费用管理的指导意见.pdf VIP
- 深圳新桥街道万丰社区大朗山片区城市更新项目.pdf
- 中小学劳动教育课程如何创新与实施.docx VIP
- 大航海时代OL陆战技巧学习指南.docx
- 集中式山地光伏电站方阵区直流电缆敷设技术要求.pdf VIP
文档评论(0)