- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在电子病历系统中应用
数据挖掘技术在电子病历系统中应用
电子病历挖掘旨在提取出电子病历数据库中有用的医疗信息,并挖掘隐含在其中的医学诊断规则和模式,从而为疾病诊断和治疗提供科学的、准确的辅助决策。电子病历数据挖掘涉及面广、技术难度大,需要从事信息处理、计算机技术、应用数学的科研人员以及具备相当经验的医务工作者通力合作。本文从电子病历数据挖掘的概念、电子病历的数据特性、电子病历数据挖掘的步骤以及应用前景等方面作了简单研究和介绍。
【关键词】电子病历 数据挖掘 预处理 应用与发展
随着数字化医院建设的不断推进和计算机应用技术的不断普及,现代医院正在逐步向无纸化运行迈进,电子病历系统作为数字化医院管理的一个重要组成部分,其囊括了医疗过程和医患活动的全部数据资源,并积累了相当庞大的数据量,通过对电子病历的数据挖掘,提取出病历数据库中的有用医疗信息,并挖掘出隐含于其中的医学诊断规则和模式,可盘活尘封的海量数据,为疾病诊断、治疗及预防提供科学准确的辅助决策。
1 电子病历数据挖掘的概念
数据挖掘DM(Data Mining)是基于数据库的知识发现KDD(Knowledge-Discovery in Databases)中的一个重要处理步骤,一般将KDD中进行知识学习的阶段称为数据挖掘,亦可译为资料探勘、数据采矿,而KDD则是指从大量的数据中提取出新颖有效的、可能有用的数据结构,形成可被理解的模式,最终实现低层数据向高层知识的转化。因此,数据挖掘可定义为是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
电子病历系统是利用现代信息技术对传统病历实现收集存储、传输共享以及分析研究等功能的一种计算机程序软件。电子病历包含的内容为医务人员在对患者进行的诊疗活动过程中,整理形成一整套的医疗活动记录,包括文字符号、图表图形、影像数据等数字化信息。
2011年卫生部制定了电子病历的基本规范,并在全国范围内110家医院开展电子病历的试点工作。经过几年的发展,电子病历系统已成为衡量医院信息化建设水平的一个重要标准,电子病历系统也积累了相当可观的数据量,并且这些数据都是患者的真实数据,对这样的数据集进行数据挖掘分析,以探求各种疾病的发展规律以及疾病之间的相互关系等、探讨对比不同治疗方案的诊疗效果,这对疾病的诊疗和医学研究等都具有巨大的价值和广阔的发展前景。
2 电子病历系统的数据特点
病历是患者在医院诊疗过程的全纪录,电子病历系统保存了这些记录的数字化信息,因此电子病历系统数据库的内容异常丰富,既包含临床诊疗参数,也涉及各类管理数据,这些数据反映了医学数据的独特性,具有如下几个特性:
2.1 电子病历数据的多样性
从信息的表现形式方面区分,电子病历数据元素可分为文字(如患者信息、病史信息、查房录、病程记录等)、数字(如体温、血压、脉搏、检验结果等)、图形图像(心电图、CT、DR图像等)、音频(如心音)等。电子病历数据的多样性是其区别于其他领域的最显著特征,同时也增加了对其进行数据挖掘的难度,尤其是在数据预处理阶段,需要对部分数据进行格式转换。
2.2 电子病历数据的动态性
有些电子病历数据具有一定的时序性,是随着时间的推移不断更新变化的,比如心电图像、24h血压测量数据等,甚至纵观患者整个诊疗过程,其病情的发展、诊疗的结果、病程记录等,都是随着时间的推移而变化的。
2.3 电子病历数据的不完整性
电子病历数据是对患者诊疗记录的如实记录,是以治愈患者为目的,而非以研究为目的,因此对电子病历数据的采集和处理可能会出现一定的偏差,采集的数据可能无法涵盖研究所需。另外,疾病本身具有的模糊性、患者的表达能力、医护人员的理解能力也不尽相同,也可能会造成数据记录的偏差和残缺。
2.4 电子病历数据的冗余性
电子病历系统是一个特殊的系统,其数据安全关乎患者的诊疗效果乃至生命安全,为进行数据校验,系统必然会存在大量重复甚至矛盾的数据。如何对这些数据进行有效性筛选、获取唯一可信的数据集,是电子病历数据清洗的一个重要步骤。
2.5 电子病历数据的隐私性
电子病历系统囊括了患者在院诊疗过程中的所有信息,其中不乏涉及患者的隐私,如身份信息、疾病信息等,一旦这些信息被暴露,很可能会对患者的生活造成侵扰,甚至会引发伦理、法律等方面的问题。因此,在对电子病历数据进行挖掘研究的同时,还应做好数据安全方面的相关工作。
3 电子病历数据挖掘的步骤
对电子病历的数据挖掘工作可分为预处理和挖掘分析两大阶段。由于电子病历数据具有多样性、时序性、不完整性等诸多特性,需要对待挖掘数据进行筛选、清洗、匿名化、标识转换等操作
文档评论(0)