- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(三)关联规则挖掘的Apriori 算法 候选1-项集 面包 4 牛奶 4 尿布 4 啤酒 3 鸡蛋1 可乐 1 频繁1-项集 面包 4 牛奶 4 尿布 4 啤酒 3 候选2-项集 面包 牛奶3 面包 尿布3 面包 啤酒2 牛奶 尿布3 牛奶 啤酒2 尿布 啤酒3 候选1-项集 面包 尿布 牛奶2 面包 尿布 啤酒 2 牛奶 尿布 啤酒 2 频繁2-项集 面包 牛奶3 面包 尿布3 牛奶 尿布3 尿布 啤酒3 Apriori 算法的基本操作步骤举例 (四)关联规则的生成 同时满足最小支持度阈值和最小置信度阈值的规则称为强规则。对于给定的一个事务集D,挖掘关联规则就是支持度和可信度分别大于用户给定的最小支持度和最小可信度的强关联规则。 (五)关联规则挖掘在卫生信息分析中的实例 (一)聚类分析的定义 聚类分析(cluster analysis)是将一组物理的或抽象的对象,根据它们之间的相似程度,分为若干组,使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象是不相似的。 聚类分析与分类不同: 对于分类问题,事先了解训练样本的分类属性,将数据对象分到不同的已知类中,如在人口统计中将每个调查对象分类到老年组、中年组等;而聚类分析,则是在划分的分类体系未知的情况下,将数据对象分组成不同类,需在训练样本中找到这个分类属性。 (二)聚类分析的基本步骤 1.计算对象间的相似性 2.将聚类对象分到各个类别 1.计算对象间的相似性 通常就是利用(各对象间)距离来表示相似性。 常用距离度量公式有欧几里得(Euclidean)距离公式。 1. 计算对象间的相似性 上述的数据矩阵经过计算对象间的欧几里得距离之后,得到的是对象间的相似矩阵。 相似矩阵 2. 将聚类对象分到各个类别 层次方法(hierarchical method)就是通过分解所给定的数据对象集来创建一个层次,直到满足某种条件为止。 自底向上(凝聚):从每个对象均作为一个单独的组开始,逐步将这些(对象)组进行合并,直到组合并在层次顶端或满足终止条件为止; 自顶向下(分裂):从所有对象均属于一个组开始,每一次循环将其组分解为更小的组,直到每个对象构成一组或满足终止条件为止。 2. 将聚类对象分到各个类别 四个广泛使用的计算聚类间距离的度量方法如下: 其中|P-P’|为两个数据对象或点P和P’之间的距离, mi是聚类Ci的平均值,ni 是聚类Ci中的对象个数。 3. 聚类分析在卫生信息分析中的实例 某市各县区8 类疾病的发病率指标 输入到SPSS中的数据矩阵 3. 聚类分析在卫生信息分析中的实例 一、 症状监测及相关概念 二、 症状监测的基本步骤与方法 三、 重要疾病爆发与流行监测系统 症状监测的概念 目前,症状监测(syndromic surveillance)被广为接受的定义是美国CDC给出的定义,即“症状监测是对临床确诊前的健康相关数据和疾病可能暴发的信号进行监测,以利于作出进一步公共卫生反应”。 该定义体现了症状监测与疾病监测的区别,它是以监测诊断前的非特异性的症状和现象为基础的。 症状监测的基本步骤与方法 ①症状群定义和数据来源; ②症状监测数据的采集; ③症状监测数据的分析; ④对异常信号的调查。 重要疾病爆发与流行监测系统 社区疾病流行早期报告电子监测系统( Electronic Surveillance System for the Early Notification of Community-based Epidemics,ESSENCE ) 实时暴发与疾病监测系统( Real-time Outbreak and Disease Surveillance,RODS ) * 无忧PPT整理发布 第一节 卫生信息分析概述 第二节 卫生信息分析方法 第三节 卫生信息分析应用:症状监测 信息分析的概念 信息分析(information analysis)的定义:信息分析是一种以信息为研究对象,根据拟解决的特定问题的需要,收集与之有关的信息进行分析研究,旨在得出有助于解决问题的新信息的科学劳动过程。 信息分析的步骤 课题选择 制订课题研究计划 信息收集 信息整理、鉴别与分析 报告编写 一、时间序列分析 二、关联规则挖掘 三、聚类分析 (一)时间序列分析概述 1. 时间序列数据 时间序列(time series)又称动态数列或时间数列,就是把所研究的事物在各个不同时间的统计指标的数值,按其发生时间先后顺序排列起来所形成的数列。 全球霍乱发病例数报告 [摘自Global Health Observatory Data Reposit
文档评论(0)