医用数据挖掘技术研究与应用进展.docx

医用数据挖掘技术研究与应用进展.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

医用数据挖掘技术研究与应用进展

?

?

徐明鹃

摘要随着网络技术和数据库技术的迅速发展,医院信息系统(HospitalInformationSystem,HIS)得到了广泛的应用,数据挖掘技术在医用数据处理和分析中的应用在医院的管理和决策中起着越来越重要的作用。本文介绍医用数据挖掘的方法,为数据挖掘技术在医用数据方面的应用作出了积极探索。

关键词数据挖掘;聚类;决策树;应用

TP31A1673-9671-(2009)112-0023-01

0引言

随着网络技术和数据库技术的迅速发展,医院信息系统在我国大中小型医院也得到了广泛应用,这对推动医院信息化建设、促进医院快速发展起到了积极作用。但是随着就诊人数的逐年增加,医院信息系统中积累了大量纷繁复杂的信息大量信息在给人们带来方便的同时也产生了“数据爆炸”的问题。那么,当数据信息积累到一定程度,如何从这些海量的医学数据中找出有价值的知识和规则,再通过这些隐藏的规律为医生疾病的诊断和治疗提供科学决策依据,并帮助管理者发现并创造新的管理决策已经成为医院管理者越来越关心的问题。

1医用数据挖掘方法

医用数据涉及医疗过程和医院活动的全部数据资源,包括临床医疗信息和医院管理信息。医疗信息具有以下特点:

1)隐私性:医用数据涉及患者的隐私问题,包括病情、个人信息等,一旦泄露,可能会使患者的日常生活遭到不可预料的侵扰。

2)多样性:医用数据来源于各种电子病历、化验检查报告和影像资料等,并且包括了医生的个人诊断信息,数据的形式多样,内容丰富。

3)复杂性:医用数据的复杂性源于其组成信息的多样性,且信息具有不确定性和不断变化等因素,在搜集和处理的过程的脱节都可能造成医用数据的不完整性。

4)冗余性:海量的医用数据的存储使得数据库中包含重复、无关紧要、甚至是相互矛盾的记录。

正是医用数据的这些特点,使得医用数据挖掘与普通的数据挖掘所采用的方法有所区别,医用数据挖掘常用的方法如下:

1)关联分析(AssociationAnalysis)

若两个或多个变量的取值之间存在某种规律性,就称为关联(Association)。关联规则(Associationrule)是指在同一个事件中出现的不同项的相关性,挖掘的对象一般是事务数据库。关联分析的目的就是用于发现隐藏在大型数据集中令人感兴趣的联系,所发现的联系可以用关联规则或者频繁项集的形式表示。

2)聚类分析(ClusteringAnalysis)

聚类分析是将一个数据集划分成若干组或类的过程,使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是不相似的。确定是否相似的描述常用各个对象间的距离(如欧氏距离)来表示。聚类分析的方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法等。

3)分类分析(ClassificationAnalysis)

分类分析的方法是使用分类函数或分类模型进行分类,根据数据的属性将数据分派到不同的组中。即分析数据的各种属性,并找出数据的属性模型,确定哪些数据属于哪些组。分类模型的构造有统计方法、机器学习方法、神经网络方法,其中比较常用的是决策树和神经网络方法。

4)序列模式分析(SequenceAnalysis)

序列模式分析是找出频繁出现的模式。序列模式分析和关联分析类似,但其目的是为挖掘出数据间的前后或因果关系。序列模式分析在股票交易、电信记录、天气数据和生产过程等商业交易分析中就显得相当重要。在进行序列模式分析时,同样需要最小支持度和最小可信度作为评价标准。

2医用数据挖掘应用进展

国内数据挖掘技术在医疗卫生领域的应用研究还处于起步阶段。来自中山大学肿瘤防治中心的研究人员通过肿瘤分子信息和数据挖掘方法可以预测早期非小细胞肺癌5年内是否死亡,这一预测的总正确率达到87.2%,该技术一旦成熟,今后每个肺癌病人开刀做完手术后,可借此预测其5年存活情况,而且检测费用远比国外的基因检测便宜;上海同济大学附属医院分析糖尿病患者肌肉组织和脂肪含量与骨密度之间的联系,得出高肌肉和高脂肪含量可以降低患者髋骨骨折的危险性;第四军医大利用数据库和数据挖掘技术建立了恶性血液病数据库分析系统;北京协和医院开展数据挖掘在临床医疗管理上的研究,为医院业务管理等提供支撑,并辅助领导决策;广州南方医院采用数据挖掘查询系统查询医生有否开大处方,病人是否花了不该花的医药费,且病人有望提前治愈出院。

目前,在医用数据的挖掘的应用主要如下:

1)关联分析

关联分析可以用来分析预测手术术后和药物治疗的效果,可以对某种疾病的相关发病因素进行分析以指导患者如何预防该疾病;可以对带病DNA和健康组织的DNA基因序列进行比较,以识别出两类基因的差别,从而得出致病因素;可以对患者的生理参数进行分析,分析各种生理参数之间的关系进而得出有意

文档评论(0)

木槿流年 + 关注
实名认证
内容提供者

悟已往之不谏,知来者之可追

1亿VIP精品文档

相关文档