- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
面向中文电子病历的NLP关键技术研究2014年4月13日Copyrights@2014HITAllRightsReserved蒋志鹏关毅哈尔滨工业大学计算机学院
2014年4月13日Copyrights@2014HITAllRightsReserved电子病历(EMR)医务人员在医疗活动过程中,使用医疗机构信息系统生成的文字、符号、图表、图形、数据、影像等数字化信息,并能实现存储、管理、传输和重现的医疗记录
2014年4月13日Copyrights@2014HITAllRightsReserved中文电子病历(CEMR)对患者身体状况的半结构化专业描述
2014年4月13日Copyrights@2014HITAllRightsReserved中文电子病历(CEMR)医疗大数据每年约15万份每天约800份每月约15000份
2014年4月13日Copyrights@2014HITAllRightsReserved目前在CEMR方面展开的研究工作中文电子病历(CEMR)
2014年4月13日Copyrights@2014HITAllRightsReservedCEMR句法树库构建语法标注结果及分析语法标注规范制定高精度词性标注系统
2014年4月13日Copyrights@2014HITAllRightsReserved基于PCTB规范进行迭代修订人机互助医生协助一致性评价语法标注规范制定
2014年4月13日Copyrights@2014HITAllRightsReserved语法标注规范制定以“抗凝”为例:筛选、补充、细化PCTB词性标注规范例如,“伴有视物模糊”中的“视物”提出适用于CEMR的术语切分方案PCTB:“吃饭”不切分,“吃梨”“吃桃”切分CEMR:“持物”“抗凝”是否切分?规范中一些重要修订
语法标注规范制定2014年4月13日Copyrights@2014HITAllRightsReserved标注质量控制表1规范修订前后主要词性歧义项分布表2前3次迭代分词和词性标注准确率及一致性PCTB词性标注规范面向电子病历的词性标注规范歧义项数量歧义项数量NNVV89NNVV47JJLC72NNM15MLC64JJNN9NNVA63NNVA9JJNN37NDNN6迭代次数中文分词词性标注A1F1值(%)A2F1值(%)IAA(%)A1Precision(%)A2Precision(%)IAA(%)196.7692.2796.5396.6888.5389.25295.5196.9497.8997.3697.8195.18398.4996.4798.2597.8097.6095.60
2014年4月13日Copyrights@2014HITAllRightsReserved语法标注规范制定分词、词性标注、句法标注规范
2014年4月13日Copyrights@2014HITAllRightsReserved语法标注规范制定标注结果138份带有词性、句法标签的电子病历来自神经内科和普通外科包括出院小结和首次病程记录
2014年4月13日Copyrights@2014HITAllRightsReserved语法标注规范制定CEMR句法树库构建的主要困难:目前没有任何基于CEMR的标注语料各级标注均需要医生的参与不同医疗机构、不同科室病历差异较大
2014年4月13日Copyrights@2014HITAllRightsReservedCEMR句法树库构建语法标注结果分析语法标注规范制定高精度词性标注系统
2014年4月13日Copyrights@2014HITAllRightsReserved包含大量专业术语(如“共济运动”、“脑梗死”)、习惯用语(如“伴”、“否认”)及缩略词(如“CT”、“MMR”)常用数字、量词和形容词表示检查结果(如“100/70mmHg”)句子结构不完整,但规律性较强频繁使用并列长句,导致句法结构趋于扁平语法标注结果分析CEMR文本语言的特点:
语法标注结果分析2014年4月13日Copyrights@2014HITAllRightsReserved通用标注模型效果词性标注平均准确率仅为82.35%Fig.2a出院小结各部分标注效果Fig.2b首次病程记录各部分标注效果
2014年4月13日Copyrights@2014HITAllRightsReserved语法标注结果分析通用标注模型效果句法分析F1(autopos):53.5
文档评论(0)