- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
成都信息工程大学硕士学位论文
基于零样本学习的中文医学命名实体识别方法研究与应用
摘要
命名实体识别可以识别电子病历中蕴含的医学实体信息,为人工智能在医
疗卫生服务中的应用提供了条件和支持。目前大多数研究采用的是有监督的深
度学习方法,并且假设训练数据中包含所有可能的实体类别,缺乏处理未见类
的能力,但是在实际应用中会不断涌现新的类别,因此需要重新标注和训练。
零样本学习允许在预测阶段引入新的类别而不需要额外的标注数据和重新训练,
通过引入对实体的描述来解决训练集的类别和测试集的类别不相交的问题,因
此本文对基于零样本学习的中文医学命名识别方法展开了研究,主要内容如下:
(1)采用类别描述信息搭建零样本学习的中文医学命名实体识别模型:本
研究首先搭建了基于类别描述的中文医学命名实体识别模型,通过类别描述信
息建立实体和其类别之间的关联,将可见的知识迁移到不可见的类别上,从而
实现在测试阶段可以引入新的类别。同时为了探究不同的描述信息对于模型识
别结果的影响,本文还采用了不同的描述信息进行实验研究。
(2)提出词嵌入共享来提高词嵌入的质量:零样本学习通过类别描述建立
实体和类别的关联,词嵌入中所包含的语义以及语法信息对建立实体和类别的
关联以及识别效果起到了至关重要的作用,因此探索高质量的、适用于中文医
学的词嵌入至关重要。本文通过词类比任务、下游任务、词嵌入可视化三种词
嵌入评价方法对不同的词嵌入进行了评估,提出了更加适合于中文医学的词嵌
入方法,实验结果表明词嵌入共享可以有效的丰富词嵌入的信息,从而进一步
提高了模型的识别效果。
(3)提出词典增强来解决中文以字符为单位、语义表达不完整的问题:上
述模型的输入都是以字符为单位,但中文字符表达不了完整的语义信息,因此
本文提出通过构造相关词搜索器加入单词的信息,使字符信息与单词信息进行
充分的融合,从而可以使词嵌入中包含更加完整的语义信息,最后将词典增强
与词嵌入共享相融合,在语义信息表达完整的情况下使其更加丰富,实验结果
充分验证了上述方法的有效性。
(4)构建基于零样本学习的中文医学命名实体识别系统,系统在识别的过
程中不用局限于预定义好的标签类别,只用输入相关的描述信息以及类别名称
就可以对文本进行识别。
关键词:零样本学习,命名实体识别,类别描述,词嵌入共享,词典增强
ii
成都信息工程大学硕士学位论文
ResearchandApplicationofChineseMedicalNamedEntity
RecognitionBasedonZero-shotLearning
ABSTRACT
NamedEntityRecognitioncanidentifymedicalentityinformationembeddedin
electronicmedicalrecords.,whichprovidesconditionsandsupportfortheapplication
ofartificialintelligenceinhealthcareservices.Currently,mostresearchinthisfield
adoptssuperviseddeeplearningmethods,assumingthatthetrainingdatacontainsall
possibleclasses,butlackingtheabilitytohandleunseenclasses.However,inpractical
applications,newclassescontinuouslyemerge,requiringre-annotationandretraining.
Zero-shotlearningallowstheintroductionofnewclassesatthepredictions
您可能关注的文档
最近下载
- 2022年国家公务员考试行测试题(有答案)(地市级).pdf VIP
- CISA考试练习习题库(2025年第1部分).pdf VIP
- 基于核心素养的小学语文作业设计策略分析.docx VIP
- T_CGSS 014—2020_老年人跌倒风险综合评估规范.pdf VIP
- 选区激光熔化技术下成形件表面质量及残余应力预测方法.pdf VIP
- 机电设备安装应急处理预案.docx VIP
- 2025入党积极分子发展对象考试题库(含答案).docx VIP
- 个人简历——【标准模板】.doc VIP
- [富士康 索尼设备校正]SI-F209 Operation Manual (中文版).pdf
- 小学语文作业设计的有效策略.doc VIP
文档评论(0)