- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
医用数据挖掘技术研究与应用进展
?
?
徐明鹃
摘要随着网络技术和数据库技术的迅速发展,医院信息系统(HospitalInformationSystem,HIS)得到了广泛的应用,数据挖掘技术在医用数据处理和分析中的应用在医院的管理和决策中起着越来越重要的作用。本文介绍医用数据挖掘的方法,为数据挖掘技术在医用数据方面的应用作出了积极探索。
关键词数据挖掘;聚类;决策树;应用
TP31A1673-9671-(2009)112-0023-01
0引言
随着网络技术和数据库技术的迅速发展,医院信息系统在我国大中小型医院也得到了广泛应用,这对推动医院信息化建设、促进医院快速发展起到了积极作用。但是随着就诊人数的逐年增加,医院信息系统中积累了大量纷繁复杂的信息大量信息在给人们带来方便的同时也产生了“数据爆炸”的问题。那么,当数据信息积累到一定程度,如何从这些海量的医学数据中找出有价值的知识和规则,再通过这些隐藏的规律为医生疾病的诊断和治疗提供科学决策依据,并帮助管理者发现并创造新的管理决策已经成为医院管理者越来越关心的问题。
1医用数据挖掘方法
医用数据涉及医疗过程和医院活动的全部数据资源,包括临床医疗信息和医院管理信息。医疗信息具有以下特点:
1)隐私性:医用数据涉及患者的隐私问题,包括病情、个人信息等,一旦泄露,可能会使患者的日常生活遭到不可预料的侵扰。
2)多样性:医用数据来源于各种电子病历、化验检查报告和影像资料等,并且包括了医生的个人诊断信息,数据的形式多样,内容丰富。
3)复杂性:医用数据的复杂性源于其组成信息的多样性,且信息具有不确定性和不断变化等因素,在搜集和处理的过程的脱节都可能造成医用数据的不完整性。
4)冗余性:海量的医用数据的存储使得数据库中包含重复、无关紧要、甚至是相互矛盾的记录。
正是医用数据的这些特点,使得医用数据挖掘与普通的数据挖掘所采用的方法有所区别,医用数据挖掘常用的方法如下:
1)关联分析(AssociationAnalysis)
若两个或多个变量的取值之间存在某种规律性,就称为关联(Association)。关联规则(Associationrule)是指在同一个事件中出现的不同项的相关性,挖掘的对象一般是事务数据库。关联分析的目的就是用于发现隐藏在大型数据集中令人感兴趣的联系,所发现的联系可以用关联规则或者频繁项集的形式表示。
2)聚类分析(ClusteringAnalysis)
聚类分析是将一个数据集划分成若干组或类的过程,使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是不相似的。确定是否相似的描述常用各个对象间的距离(如欧氏距离)来表示。聚类分析的方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法等。
3)分类分析(ClassificationAnalysis)
分类分析的方法是使用分类函数或分类模型进行分类,根据数据的属性将数据分派到不同的组中。即分析数据的各种属性,并找出数据的属性模型,确定哪些数据属于哪些组。分类模型的构造有统计方法、机器学习方法、神经网络方法,其中比较常用的是决策树和神经网络方法。
4)序列模式分析(SequenceAnalysis)
序列模式分析是找出频繁出现的模式。序列模式分析和关联分析类似,但其目的是为挖掘出数据间的前后或因果关系。序列模式分析在股票交易、电信记录、天气数据和生产过程等商业交易分析中就显得相当重要。在进行序列模式分析时,同样需要最小支持度和最小可信度作为评价标准。
2医用数据挖掘应用进展
国内数据挖掘技术在医疗卫生领域的应用研究还处于起步阶段。来自中山大学肿瘤防治中心的研究人员通过肿瘤分子信息和数据挖掘方法可以预测早期非小细胞肺癌5年内是否死亡,这一预测的总正确率达到87.2%,该技术一旦成熟,今后每个肺癌病人开刀做完手术后,可借此预测其5年存活情况,而且检测费用远比国外的基因检测便宜;上海同济大学附属医院分析糖尿病患者肌肉组织和脂肪含量与骨密度之间的联系,得出高肌肉和高脂肪含量可以降低患者髋骨骨折的危险性;第四军医大利用数据库和数据挖掘技术建立了恶性血液病数据库分析系统;北京协和医院开展数据挖掘在临床医疗管理上的研究,为医院业务管理等提供支撑,并辅助领导决策;广州南方医院采用数据挖掘查询系统查询医生有否开大处方,病人是否花了不该花的医药费,且病人有望提前治愈出院。
目前,在医用数据的挖掘的应用主要如下:
1)关联分析
关联分析可以用来分析预测手术术后和药物治疗的效果,可以对某种疾病的相关发病因素进行分析以指导患者如何预防该疾病;可以对带病DNA和健康组织的DNA基因序列进行比较,以识别出两类基因的差别,从而得出致病因素;可以对患者的生理参数进行分析,分析各种生理参数之间的关系进而得出有意
您可能关注的文档
- 医疗纠纷的现状及对医院和医务人员的影响.docx
- 从课堂实践中浅谈浮力的教学改进分析.docx
- 中职教育校企合作优化路径研究.docx
- 会计职业道德现状与建设对策.docx
- 乌饭树叶中粗黄酮的提取及抗氧化性研究.docx
- 大学英语教学中的跨文化教学研究.docx
- 中国FDI存量与人力资本的区域匹配性分析.docx
- 城市演进中智慧文化空间的研究.docx
- 中药企业质量管理问题及对策.docx
- 办公系列家具竹材特性分析.docx
- 2026年投资项目管理师之宏观经济政策考试题库300道附答案【精练】.docx
- 超星尔雅学习通《形势与政策(2025春)》章节测试附完整答案(网校专用).docx
- 超星尔雅学习通《形势与政策(2025春)》章节测试带答案(研优卷).docx
- 超星尔雅学习通《形势与政策(2026春)》章节测试题附参考答案(实用).docx
- 2026年刑法知识考试题库a4版.docx
- 2026年刑法知识考试题库标准卷.docx
- 2026福建泉州市面向华南理工大学选优生选拔引进考试题库新版.docx
- 2026年国家电网招聘之文学哲学类考试题库300道含完整答案(夺冠).docx
- 2026年法律职业资格之法律职业客观题一考试题库300道含答案【巩固】.docx
- 2026年刑法知识考试题库【精练】.docx
最近下载
- 专利转让合同模板(2024版).docx VIP
- 2023年沧州幼儿师范高等专科学校招聘笔试真题及参考答案详解1套.docx VIP
- 2025年无人机驾驶员执照多机协同任务通信规划与执行专题试卷及解析.pdf VIP
- 2025贵州水投水务集团有限公司第二批次招聘笔试备考试题及答案解析.docx VIP
- 人教版初中数学九年级上册期末测试卷(较易 )(含答案解析) .pdf VIP
- 北师大版数学八年级上册第五章二元一次方程组题型举一反三.docx VIP
- 禁用物质管理程序.doc VIP
- 滚动轴承故障诊断(附MATLAB程序).pdf
- 重庆青年职业技术学院招聘考试真题2024.pdf VIP
- 二等水准测量记录计算示例.doc VIP
原创力文档


文档评论(0)