数据挖掘及其在医学领域中的应用和展望.pdfVIP

数据挖掘及其在医学领域中的应用和展望.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘及其在医学领域中的应用和展望.pdf

icine,2006,Voi 7,Noll 实用临床医学2006年第7卷第11期 PracticalClinical Med— — — 数据挖掘及其在医学领域中的应用和展望 徐 刚,袁兆康 (南昌大学医学院公共卫生学院,南昌330006) 关键词:数据挖掘{医学信息;医学应用 中国分类号:TP3—05;R195.1 文献标识码:A 文章编号:10O9—8194(2006)11—0196--03 信息化、网络化时代,伴随数据库技术以及信息管理系 1.3 常用数据挖掘方法 统在医疗机构的广泛运用,促进了医学信息的数字化.信息 分析时需根据不同目的,运用不同方法.且单一分析方 量的剧增,然而由此却导致了信息过量难消化、真假难分、形 法常难满足要求。当前数据挖掘工具常采用决策树、神经网 式不一致难处理的困惑。但是在这大量的数据后面却蕴含 络、关联规则、()LAP联机分析处理、遗传算法、K-nearest邻 了许多对疾病的诊断、治疗以及卫生行政决策有重大价值的 居、数据可视化和传统统计方法等。这些方法中蕴含大量的 信息。常用的数据库及传统的统计分析方法已经远不能满 挖掘模型,医疗领域常用的是关联分析、趋势分析、分类分 足现实的要求,为了解决把数据灾难变为数据宝库的需求, 析、聚类分析、序列分析、偏差检测和可视化技术 ]。 一 门融合人工智能、机器学习、数理统计等方法的新型学科 决策树:是建立在信息论基础上的.主要解决分类问题 技术即数据挖掘诞生了。目前,该技术在医学领域应用尚处 的一种方法.它利用信息增益寻找数据库中最大信息量的属 于起步阶段,因而阐述其理论框架及其在医学领域应用的特 性建立一个节点,采用剃归方式自顶向下逐个据节点属性的 殊性和当前在医疗领域应用研究现状很有必要 不同取值建立树的分支,从而构建树的模型 它实现了数据 1 数据挖掘理论框架及其发展 规则的可视化.具有精度高、结果易理解、效益高的优点【7]。 1.1 数据挖掘概念及特点 与传统的统计方法比较,它是严格“非参”而叉类似判别分析 数据挖掘[1](data mining)是指从大量的、不完全、有噪 的有监督的学习方法;是基于对属性的布尔型和比较运算的 声、模糊、随机的数据中提取蕴含其中的,事先不得知但又潜 逻辑判断;它在结果表达、缺失值处理、对于变量要求以及模 在有用的信息和知识的过程。由于其是汇集数据库、人工智 型评价方面有其独特性 。 。然而由于其算法尚处发展完 能、统计学等不同学科领域知识的交叉学科,从而近年来备 备阶段,其亦有诸如:选取分类变量时易选取取值较多的变 受关注。它与知识发现(KDD)有不同的含义,FAYYAD 量进入模型;尚不能直接利用连续变量值,从而损失一定量 UM等 ]将KDD定义为:从大量数据中提取可信的、新颖 信息的弊端 。目前在实际资料的处理中通常将其与其它 的 有效的并能被人理解的模式的高级处理过程。严格讲, 方法联用。 DM仅仅是KDD的一个处理过程.是KDD的最为关键环 神经网络:是建立在自学习的数学模型基础上。通过训 节 它们是按照既定的目标探索大量数据,找出内在规律形 练来学习的非线性预测模型,它在机器学习中作分类器使用 成模型化,从而做出预测和描述提供决策支持口]。 很普遍。其分类精度远高于决策树,可以对大量复杂的数据 1.2 数据挖掘基本过程 分析。完成对人脑或其它计算机而言极为复杂的模式抽取及 数据挖掘一般有如下几个步骤

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档