- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
语素级临床汉语言解析引擎及在电子病历中的应用
① ①
胡安邦 廖邦富
①成都成电医星数字健康软件有限公司,610047,成都市武侯区武科东四路 11 号 慧谷 5
栋4 号
摘 要 语素级临床汉语言解析引擎,是实现电子病历结构化和智能化的技术方法。该引
擎可以实现对电子病历的后台语素级解析,达到每秒钟 10000 个汉字解析速度;96%以上有
效语素的匹配度;98.5%以上有效语素的匹配正确性。达到电子病历真正结构化,更低社会
成本,智能化的要求。
关键词 电子病历 语素 汉语言解析 智能化
1 概述
电子病历文书的编辑是电子病历的重要内容。很多对电子病历软件的宣传时,重点在描
述一个好的病历编辑器。如何输入,如何结构化,如何适应不同的格式,如何进行数据的存
储等。把结构化作为电子病历的一个主要特点和要求。大家都讲结构化的好处,但几乎都不
讲结构化的成本和实际效果。目前电子病历的一个弊病就是结构化成本很高,以至于在实际
应用声称结构化的电子病历,多数并没有真正结构化。
非结构化的电子病历的弊病非常明显。但结构化成本太高,效果差的问题很少有人提起。
比如点选模式的电子病历,需要书写“无明显诱因,饮酒后,受凉后,劳累时……”,医生
需要进行多次选择并确认。这种方式存在问题很明显:严重干扰医生思维,书写这样一份结
构化的病历花费的时间太长,浪费最昂贵的医疗资源--医生的时间;以至于很多医务人员弃
之不用。而且更重要的是,这种选择性输入的电子病历,并不能真正保证电子病历的结构化,
因为这种方法,不能达到语义或语素级的结构化水平,不能很好的满足电子病历智能化的需
求。
对于电子病历是否结构化、如何结构化,解决之道各有不同。在美国和英国,因为结构
化成本太高,解决之道是通过便宜的资源(转录员)代替医生录入病历;在法国,干脆就规
定少写病历;在我国,基本上是采用成本最高的选择性输入方法,来解决电子病历结构化的
问题。
电子病历的结构化并不仅仅是成本问题。电子病历的结构化,是电子病历智能化的基础。
只有实现了电子病历的真正结构化,才能实现电子病历的智能化。这是在全世界都是一个难
题。
如何解决这个世界级的难题。是否能考虑医生用自然语言输入电子病历,把复杂的结构
化过程交给计算机完成,通过计算机的语义或语素的解析,实现电子病历的结构化、智能化。
这是很多人都在思考或研究的问题。但这种方法的难度太大。因为语言的灵活、多变,给语
义或语素的解析造成了巨大的障碍。我国的汉语言的多样性和灵活性更在其它语言之上。与
英语等西方语言的以词组句不同,汉语言是以字组词、以词组句,更为复杂,更难实现汉语
言计算机语义或语素级的解析。
对于汉语言的解析的研究和计算机软件的开发,国内的研究比较多。如北大计算机语言
学研究所的相关软件,是这方面比较成熟的软件。但是该软件实际上只有对词法的解析 (动
词,名词等)方面比较成熟。由于侧重点不同,该软件对词法的解析中,并未对词的具体逻
辑含义进行解析。而语义或语素的解析算法更加复杂,还未真正实现。
2 语素级临床汉语言解析引擎的研究
我们在电子病历软件的开发过程中,为了实现电子病历真正的结构化和智能化。对临床
汉语言的语素级解析进行了研究。自主开发了语素级临床汉语言解析引擎,并嵌入电子病历
系统。对汉语言电子病历进行后台语素级的解析,随电子病历一起保存,实现电子病历的结
构化。并为实现电子病历的智能化利用奠定了基础。
语素则是最小的语法单位,是表达语义的最小的语言。比如:少许,严重,水肿,色泽,
高度,黄染,右下,气海,太阳蓄水证,胸透,Murphy 征等。
在语素级临床汉语言解析引擎中,将临床汉语语素分类为:症状:ZZ (否定症状:NZZ),
部位:BW,属性:SX,时间:SJ,检查:JC,量度:LD 等等。各分类语言有其组成(比如症状
就分为:症状主体(ZZ.1),症状时间(ZZ.2),症状部位(ZZ.3),症状属性(ZZ.4),症状
量度(ZZ.6)等等,进行解析。
例如医生书写的现病史:“入院前2 小时于晨起穿衣时突然出现左侧肢体活动不能,无
法自行穿衣,言语欠清晰,无头昏、头痛,无恶心、呕吐,无抽搐及意识障碍,无大小便失
禁,家人发现后即送我院急诊科,经头颅 CT:颅内未见明显异常。”经过引擎解析后,结果
如下:
• C1
•
文档评论(0)