- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医疗数据挖掘特点过程及方法
医疗数据挖掘特点过程及方法
The Characteristics, Process and Methods of Medical Data Mining
Hong Hong; Li Lingjuan
( 南京中医药大学信息技术学院,南京 210046)
(College of Information and Technology,Nanjing University of Chinese Medicine,Nanjing 210046,China)
摘要: 近年来,医疗数据资料持续爆炸性增长,在治疗技术不断提升的同时也带来了新的问题――数据丰富,知识贫乏。由此,引入了新的处理方式――数据挖掘。医疗数据挖掘面向整个医疗数据库或医疗信息集合,为其提供知识、规则和决策。本文分析了医疗数据的特点和该领域知识获取的特点、步骤及方法。
Abstract: Nowadays, with the sustained and explosive growth of medical data , the curative technology was greatly improved but a new problem also emerged: there were rich data but less knowledge. Therefore, the new method of data mining is applied now. Data mining has provided knowledge ,rules and decision for the whole medical database or the integration of medical information. This paper analyzes the characteristics of medical data , the basic steps and methods of getting knowledge in medical data field which has significant meaning for the processing of medical data.
关键词: 医疗数据 数据特点 数据挖掘
Key words: medical data;the characteristics of data;data mining
中图分类号:TP39文献标识码:A文章编号:1006-4311(2011)32-0166-02
0引言
数据挖掘是未来信息处理的骨干技术之一,它以一种全新的概念改变着人类利用数据的方式。数据挖掘技术在医疗领域的应用有其自身的优势,因为医疗过程中收集到的数据一般是真实可靠、不受其他因素影响的,而且数据集的稳定性较强。这些对挖掘结果的维护、不断提高挖掘模式的质量都是非常有利的条件。[1]
1医疗数据特点
医疗数据挖掘和其他挖掘领域的不同,一定程度上是由于原数据特性不同而导致的。医疗数据是在对病人的诊断治疗中获得的,包括了与病人的交谈记录,各种医学仪器拍摄的图片,医生的观察说明等。人类是地球上最受关注的物种,其可供观测的一些方面是很难在其他动物研究中得到的,例如视觉、听觉、对疼痛的感知、不舒适和幻觉等[2] [3]。医疗数据挖掘在所有的生物信息数据挖掘中是收获最大但最困难的。动物实验一般是短期的,因此不能追踪观察长期疗效,如对动脉硬化症的疗效,直接使用人类的医疗数据就没有使用动物实验推测到人类医疗时所产生的问题[2]。医疗数据具体特点概括如下:
1.1 异构性指医疗数据类型的多样化。医疗数据的类型包括了数值型数据、类别型数据、图像、文字、信号、语音、视频等,所以结构类型众多。[4]这种多模式特性是它区分其他领域数据的最显著特点,并且加大了知识发现的难度,使开发基于医疗数据库的通用软件系统较为复杂。
1.2 海量性由于医疗工作自身的特点,如病情观察的不可间断、各种医疗检查结果纷繁复杂以及存有大量的医学文献专著等,导致医疗数据量非常巨大,尤其现在越来越多的医疗单位使用高科技的医学检查设备(如SPEC,MRI,PET等),而这些设备每天都会产生数千兆字节的数据。[2]
1.3 数学表征不显著物理学家收集数据后带入公式模型,可以得到较好反应数据间关系的模式,而医疗数据混合了文字、图形等非数值型数据,使得数据挖掘人员并不能很好的找到可以反应数据间联系的模型。
1.4 主观性实验和诊断都会带有主观性,也就难以发掘知识。同一个领域的顶尖专家都会对对方的诊断带有异议,这就会难以整合。
1.5 标准化危机在
原创力文档


文档评论(0)