【2017年整理】数据挖掘在医学方面的应用.doc

【2017年整理】数据挖掘在医学方面的应用.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【2017年整理】数据挖掘在医学方面的应用

数据挖掘在医学方面的应用 摘要:着信息技术的发展,采集、存储和管理数据的手段日益完善。数据挖掘学科应运而生。本文介绍数据挖掘的概念和应用,以及国内医学方面数据挖掘的应用现状及展望。 关键字:数据挖掘 医学 Abstract: The discipline of data mining emerges with the development of technology and maturation of methods of data collection, storage and management. The paper introduces the concept of data mining. This paper introduces data mining concepts and applications, as well as domestic medical data mining application status and its prospect. Key Words: data mining;biomedical 1引言 随着数据库技术的飞速发展,信息技术已渗透到包括医学在内的各种领域。很多大中型医院都相继建立了自己的医院信息系统(HIS),随着HIS的应用和不断发展,数据库中的数据量迅速膨胀,数据库规模逐渐扩大,复杂程度日益增加。但是尽管积累了大量的业务数据,真正能将这些数据的价值挖掘出来,并运用到医院的临床辅助诊断和日常管理决策中去的却很少。提出了建立基于HIS系统的医学信息数据仓库,在此基础上,对数据仓库中的医疗数据进行疾病监测、预测、医院管理辅助决策等方面的数据挖掘。为医务工作者、临床管理人员、科研人员提供辅助决策与综合分析的工具。在医疗方面具有重要的意义。 2.数据挖掘技术介绍 2.1数据挖掘额的概念 数据挖掘是商务智能应用中较高层次的一项技术,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程1。利用数据挖掘用户将可以更加方便地发现数据的规律,用户可以利用这些规律对某些符合特征的数据作出预测。 数据挖掘所得到的信息应具有先未知,有效和可实用三个特征。先未知是指数据挖掘所得到的信息应该是先前不能凭直觉或一般的技术方法所能得到的信息,挖掘到的住处越是出乎意料就可能越有价值。在这方面的一个典型例子就是一家连锁商店通过数据挖掘发现小孩尿布和啤酒之间有着惊人的联系。而有效和可实用是数据挖掘的目的所在。 数据挖掘的分析方法有很多种,针对不同的用途就有不同的分析方法,比较常见的分析方法有一下集几种:分类、预测、相关性分组活关联规则、聚类、估值、描述和可视化、复杂数据类型挖掘,包括文本数据挖掘。WEB数据挖掘、图形图像数据挖掘、视频和音频数据挖掘。 2.2数据挖掘的过程 数据挖掘的过程一般由三个主要的阶段构成:数据准备、开采操作、结果表达和解释,对知识的发现可以描述为这三个阶段的反复过程。 (1)数据准备 这个阶段又可进一步分成三个子步骤:数据集成,数据选择、数据预处理。数据集成将多文件和多数据库运行环境中的数据进行组合,解决语义模糊性,处理数据中的遗漏和清洗无效数据等。数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量。预处理是为了克服目前数据挖掘工具的局限性。 (2)数据挖掘 这个阶段进行实际性分析工作,包括的要点是:先决定如何产生假设,是让数据挖掘系统为用户产生假设,还是用户自己对数据库中可能包含的知识提出假设,前一种称为发现型的数据挖掘;后一种称为验证型的数据挖掘。再选择合适的工具进行发掘知识的操作,最后进行证实。 (3)结果表述和解释 根据用户的需求对提取的信息进行分析,挑选出有效信息,并且通过决策支持工具进行移交。因此,这一步骤的任务不仅是把结果表达出来(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能令用户满意,需要重复以上数据挖掘的过此,这一步骤的任务不仅是把结果表达出来(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能令用户满意,需要重复以上数据挖掘的过程。 2.3数据挖掘的功能 (1)自动预测趋势和行为:数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。 (2)关联分析:数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联。关联分析的目的是找出数据库中隐藏的关联网。有时并不知道数据库中数据的关联函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。 (3)聚类:数据库中的记录可被划分为一系列有意义的子集,即聚类。聚

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档