- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CRF与规则相结合的医学病历实体识别.pdf
第32卷第4期 计 算 机 应 用 研 究 Vo1.32No.4
2015年4月 ApplicationResearchofComputers Apr.2015
CRF与规则相结合的医学病历实体识别冰
栗 伟h,赵大哲h ,李 博h,彭新茗 ,刘积仁
(1.东北大学a.医学影像计算教育部重点实验室;b.信息科学与工程学院,沈阳110004;2.东软集团股份有限
公司,沈阳 110179) r
摘 要:针对电子病历结构化中命名实体识别困难的问题,提出了一种基于CRF与规则相结合的医学病历实
体识别算法。该算法采用CRF进行病历实体的初始识别,然后基于规则进行病历实体识别结果优化,其 中规则
包括基ff-gt策树生成的规则和临床知识规则。实验证明,该算法对病历实体进行识别时准确率及召回率分别最
高达到91.03%和 87.26%,满足临床中系统应用需求,同时实验表明该算法具有很好的鲁棒性和稳定性。
关键词:电子病历;病历实体;命名实体识别;条件随机场 ;决策树
中图分类号:TP391.4 文献标志码:A 文章编号:1001—3695(2015)04—1082·05
doi:10.3969/i.issn.1001-3695.2015.04.029
CombiningCRFandrulebasedmedicalnamedentityrecognition
LIW eih ZHAO Da-zhe ,¨ LIBoh PENGXin.ming ,LIUJi—ren ,
. , ,
(1.a.KeyLaboratoryofMedicalImageComputingofMinistryofEducation,b.CollegeofInformationScienceEngineering,Northeastern
University,Shenyang110004,China;2.Neus GroupLtd.,Shenyang110179,China)
Abstract:Inthepreprocessingstepofelectronicmedicalrecordsanalysis,medicalnamedentityrecognitionisakeyissue.
ThispaperproposedacombiningCRFandrulebasedmedicalnamedentityrecognitionalgorithm.Thealgorithm madeanini—
tialentityrecognitionbyCRFandthenappliedarulebasedrecognitionmethodtoimprovetheaccuracy,whoseurlesincluded
therulesfrom decisiontreeanddomainknowledge.Th eresuhsshow thatthealgorithm hashighaccuracyandrecallperfor—
manceatrecordsentityrecognitionthatisupto91.03% and87.26% ,andmeetstherequirementoftheclinicalapplication.
Meanwhile,thealgorithm hasgoodrobustnessandstabilityondifferentsizes,typesofthedataset.
Keywords:electronicmedicalrecord(EMR);medicalnamedentity;namedentityrecognition;conditionalrandom field
(CRF);decisiontree
您可能关注的文档
- 122体系铁基超导线带材研究进展.pdf
- 140t RH精炼炉物理模拟研究与应用.pdf
- 1750mm冷连轧不锈带钢高效轧制的跟踪实现.pdf
- 2,3-二羟基丙基二硫代碳酸钠对铜铅硫化矿可浮性的影响.pdf
- 2013年农家书屋研究综述.pdf
- 5-氨基间苯二甲酸敏化LaF3∶Tb发光纳米粒子的合成及其细胞成像.pdf
- 7.9Mn-1.4Si-0.07C钢高强韧机理研究.pdf
- 800MPa级水电用钢的微观组织和力学性能研究.pdf
- A Study on Application of Task-based Teaching Approach to College Oral English Teaching.pdf
- AH32钢板坯连铸凝固传热过程数值模拟.pdf
文档评论(0)