- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(三)关联规则挖掘的Apriori 算法 候选1-项集 面包 4 牛奶 4 尿布 4 啤酒 3 鸡蛋1 可乐 1 频繁1-项集 面包 4 牛奶 4 尿布 4 啤酒 3 候选2-项集 面包 牛奶3 面包 尿布3 面包 啤酒2 牛奶 尿布3 牛奶 啤酒2 尿布 啤酒3 候选1-项集 面包 尿布 牛奶2 面包 尿布 啤酒 2 牛奶 尿布 啤酒 2 频繁2-项集 面包 牛奶3 面包 尿布3 牛奶 尿布3 尿布 啤酒3 Apriori 算法的基本操作步骤举例 (四)关联规则的生成 同时满足最小支持度阈值和最小置信度阈值的规则称为强规则。对于给定的一个事务集D,挖掘关联规则就是支持度和可信度分别大于用户给定的最小支持度和最小可信度的强关联规则。 (五)关联规则挖掘在卫生信息分析中的实例 (一)聚类分析的定义 聚类分析(cluster analysis)是将一组物理的或抽象的对象,根据它们之间的相似程度,分为若干组,使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象是不相似的。 聚类分析与分类不同: 对于分类问题,事先了解训练样本的分类属性,将数据对象分到不同的已知类中,如在人口统计中将每个调查对象分类到老年组、中年组等;而聚类分析,则是在划分的分类体系未知的情况下,将数据对象分组成不同类,需在训练样本中找到这个分类属性。 (二)聚类分析的基本步骤 1.计算对象间的相似性 2.将聚类对象分到各个类别 1.计算对象间的相似性 通常就是利用(各对象间)距离来表示相似性。 常用距离度量公式有欧几里得(Euclidean)距离公式。 1. 计算对象间的相似性 上述的数据矩阵经过计算对象间的欧几里得距离之后,得到的是对象间的相似矩阵。 相似矩阵 2. 将聚类对象分到各个类别 层次方法(hierarchical method)就是通过分解所给定的数据对象集来创建一个层次,直到满足某种条件为止。 自底向上(凝聚):从每个对象均作为一个单独的组开始,逐步将这些(对象)组进行合并,直到组合并在层次顶端或满足终止条件为止; 自顶向下(分裂):从所有对象均属于一个组开始,每一次循环将其组分解为更小的组,直到每个对象构成一组或满足终止条件为止。 2. 将聚类对象分到各个类别 四个广泛使用的计算聚类间距离的度量方法如下: 其中|P-P’|为两个数据对象或点P和P’之间的距离, mi是聚类Ci的平均值,ni 是聚类Ci中的对象个数。 3. 聚类分析在卫生信息分析中的实例 某市各县区8 类疾病的发病率指标 输入到SPSS中的数据矩阵 3. 聚类分析在卫生信息分析中的实例 一、 症状监测及相关概念 二、 症状监测的基本步骤与方法 三、 重要疾病爆发与流行监测系统 症状监测的概念 目前,症状监测(syndromic surveillance)被广为接受的定义是美国CDC给出的定义,即“症状监测是对临床确诊前的健康相关数据和疾病可能暴发的信号进行监测,以利于作出进一步公共卫生反应”。 该定义体现了症状监测与疾病监测的区别,它是以监测诊断前的非特异性的症状和现象为基础的。 症状监测的基本步骤与方法 ①症状群定义和数据来源; ②症状监测数据的采集; ③症状监测数据的分析; ④对异常信号的调查。 重要疾病爆发与流行监测系统 社区疾病流行早期报告电子监测系统( Electronic Surveillance System for the Early Notification of Community-based Epidemics,ESSENCE ) 实时暴发与疾病监测系统( Real-time Outbreak and Disease Surveillance,RODS ) * 无忧PPT整理发布 第一节 卫生信息分析概述 第二节 卫生信息分析方法 第三节 卫生信息分析应用:症状监测 信息分析的概念 信息分析(information analysis)的定义:信息分析是一种以信息为研究对象,根据拟解决的特定问题的需要,收集与之有关的信息进行分析研究,旨在得出有助于解决问题的新信息的科学劳动过程。 信息分析的步骤 课题选择 制订课题研究计划 信息收集 信息整理、鉴别与分析 报告编写 一、时间序列分析 二、关联规则挖掘 三、聚类分析 (一)时间序列分析概述 1. 时间序列数据 时间序列(time series)又称动态数列或时间数列,就是把所研究的事物在各个不同时间的统计指标的数值,按其发生时间先后顺序排列起来所形成的数列。 全球霍乱发病例数报告 [摘自Global Health Observatory Data Reposit
您可能关注的文档
最近下载
- 第五单元草原牧歌——《父亲的草原母亲的河》课件2024-2025学年人音版(2024)初中音乐七年级上册.pptx VIP
- (2025秋新版)部编版八年级上册道德与法治《第三课共建网络美好家园》ppt课件.pptx
- NB-T11409-2023水电工程费用构成及概(估)算费用标准.pdf VIP
- 养鸡技术大全技术详略 - 畜牧.docx VIP
- 苏教版六年级上册《科学》全套教学课件(共531页PPT).pptx
- 湘科版2017版小学科学六年级【上册】全册教案详解.pdf VIP
- 宗教事务条例培训.pptx
- 慢性痛风性关节炎伴多发性痛风石一例并文献复习.pdf VIP
- 5.1 认识大数据 课件 粤教版(2019)高中信息技术必修1.pptx VIP
- 23J916-1 住宅排气道(一)图集.pdf VIP
文档评论(0)