生物医学数据挖掘参考课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6.1.2关联规则的质量和重要性 1、关联规则的支持度 S{A→B}=NA→B/N 2、关联规则的置信度 C{A→B}=NA→B/NA 3、关联规则的提升度 L{A→B}= C{A→B}/S{B} * 6.2关联规则的分析方法 6.2.1关联规则分析的基本方法 6.2.2剪枝和合并 剪枝:指将支持度小于预先设置阈值的特征属性过滤掉,不将其构成规则组合的过程。 合并:指将过滤后保留的特征属性加以组合,以精简最总所得的规则。 * 6.3关联规则的应用——糖尿病患者的筛查 6.3.1研究目的分析 从积累的大量数据中发现和糖尿病相关的模式和规则,以帮助医生加深对糖尿病的理解。 6.3.2数据采集及预处理 6.3.3数据挖掘与分析 * 6.4关联规则的应用——院内感染检测控制 6.4.1研究目的分析 根据已收集到的住院病史记录数据,以关联规则分析为技术方法,从中寻找和发现与院内感染共生的抗生素耐药性等现象。 6.4.2数据采集及预处理 6.4.3数据挖掘与分析 * 第七章 时间序列分析 * 第八章 序列分析 * 将原始数据的变化范围变换到另一个指定的取值范围,以取得更好的数据挖掘效果,这种变换数据取值范围的过程称为数据的归一化。常用的数据归一化方法: 十进计数法 最小最大归一法 Z分数归一法 对数归一法 * 2.3.6数据精简 1.样本数据的选择 随机选取 典型性分数 2.数据特征属性的选择 逐一尝试 涉企相关性高的特征 舍弃分类型特征 舍弃数值型特征 特征复合 * * * * * * * * * 分组 分组1 分组2 分组3 均值±方差 原数据 129,131,124 136,131,132 138,134,139 132.67±4.69 均值 平滑 128,128,128 133,133,133 137,137,137 132.67±3.91 中值 平滑 129,129,129 132,132,132 138,138,138 133.00±3.97 边界值平滑 131,131,124 136,131,131 139,134,139 132.89±4.73 * 第三章 回归分析 * 3.1回归分析的功能 * 3.2常用的回归分析方法 3.2.1线性回归 3.2.2Logistic回归 3.2.3人工神经网络 3.2.4回归树 * * * * * * * 第四章 分类 * 第五章 聚类分析 * 5.1聚类分析的功能 5.1.1聚类分析的定义与作用 聚类是一种数据分析方法,它面向一个数据集,将其中全体数据分别划归不同组别。 聚类依据原则:同一类别内的各个数据相似性较高,不同类之间的数据相似性较低。 聚类作用:可根据其内在属性将数据归纳为不同的类别,并借此了解数据属性的分布规律;也可作为数据预处理的手段,为实施其他数据挖掘技术进行数据准备。 * 5.1.2聚类分析中的相似性度量 1、由特征属性确定的相似性 2、数值型数据之间的相似性 3、二值型数据之间的相似性 4、分类型数据之间的相似性 5、排序型数据之间的相似性 6、混合型数据之间的相似性 * 例:现有若干个样本根据由6个特征属性构成,特征属性的名称及各样本数据的相应特征值如表,计算各个样本数据之间的相似程度。 记录 性别 年龄组 收缩压 舒张压 糖尿病类型 心绞痛 1 1 2 200 120 1 0 2 0 3 180 105 2 1 3 1 1 110 80 0 0 … … … … … … … * 5.2聚类分析的方法 5.2.1聚类分析方法 1、划分法 第一步:任选k个样本数据 第二步:进行第一轮聚类 第三步:进行第二轮聚类 第四步:计算聚类误差E 2、分层 分层聚类法可分为两种实施方案:凝聚性分层聚类,分裂型分层聚类 5.2.2高维特征空间中的聚类 * 5.3聚类分析的应用——住院患者人群分类 5.3.1研究目标 根据某地区若干医院住院患者的实际情况,将其划分为若干类别,并分析这些类别患者的某些共性。 5.3.2数据采集与处理 划分住院患者类别依据的特征:患者的年龄,主要诊断分类,住院时间,住院病区和收入水平等 5.3.3数据挖掘与分析 * 第1类 第2类 第3类 第4类 第5类 第6类 合计 第1类

文档评论(0)

WJDTX + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档