医学大数据分析 课件 第9、10章 聚类方法、 时间序列分析.pptx

医学大数据分析 课件 第9、10章 聚类方法、 时间序列分析.pptx

  1. 1、本文档共127页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;;;什么是聚类?;什么是聚类?;聚类和分类的区别;有监督学习;无监督学习;分类图示;聚类图示;;距离度量;距离度量;;划分方法;k均值聚类;k均值聚类;k均值聚类;k均值聚类缺陷;k-中心点聚类;k-中心点聚类;k-中心点聚类-优缺点;k-中心点聚类-优缺点;;层次聚类;层次聚类-步骤;层次聚类-距离;层次聚类-距离;当算法使用最小距离衡量簇间距离时,称为最近邻聚类算法。此外,如果当最近的簇之间的距离超过某个任意的阈值时聚类过程就会终止,则称其为单连接算法。

当一个算法使用最大距离度量簇间距离时,称为最远邻聚类算法。如果当最近簇之间的最大距离超过某个任意的阈值时聚类过程就会终止,则称其为全连接算法。;先将五个样本都分别看成是一个簇,最靠近的两个簇是3和4,因为他们具有最小的簇间距离D(3,4)=5.0

第一步:合并簇3和4,得到新的簇集合1,2,(3,4),5;第二步:更新距离矩阵:

D(1,(3,4))=min(D(1,3),D(1,4))=min(20.6,22.4)=20.6

D(2,(3,4))=min(D(2,3),D(2,4))=min(14.1,11.2)=11.2

D(5,(3,4))=min(D(3,5),D(4,5))=min(25.0,25.5)=25.0;;最小和最大度量代表了簇间距离度量的两个极端。它们趋向对离散点或噪声数据过分敏感。

使用均值距离和平均距离是对最小和最大距离之间的一种折中方法,而且可以克服离群点敏感性问题。

尽管均值距离计算简单,但是平均距离也有它的优势,因为它既能处理数值数据又能处理分类数据。;层次聚类方法尽管简单,但经常会遇到合并或分裂点选择的困难。这样的决定是非常关键的,因为一旦一组对象合并或者分裂,下一步的处理将对新生成的簇进行。(不能撤销先前步骤所做的工作)

不具有很好的可伸缩性,因为合并和分裂的决定需要检查和估算大量的对象或簇,时间复杂度为O(n2);;36;37;38;39;;;;;引子;;;;时间序列概述——分类;;;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;;;;时间序列的组成成分:长期趋势(SecularTrend);时间序列的组成成分:季节变动(SeasonalVariation)

;时间序列的组成成分:循环变动(CyclicalVariation)

;时间序列的组成成分:不规则变动(IrregularVariation)

;;;时间序列的分解:加法模型

;时间序列的分解:乘法模型

;时间序列的分解:加乘混合模型

;;;;;;;N期移动平均数;中心化移动平均;N的取值;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;(2).加权移动平均;(3).趋势移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:指数平滑法;确定性时间序列模型:指数平滑法;确定性时间序列模型:指数平滑法;确定性时间序列模型:指数平滑法;例题10-3:某医院某科室2012年1月至11月的门诊收入依次为9.03,9.06,9.12,8.73,8.94,9.30,9.15,9.36,9.45,9.30,9.24,试用指数平滑法预测12月份的门诊收入。;例题10-3:某医院某科室2012年1月至11月的门诊收入依次为9.03,9.06,9.12,8.73,8.94,9.30,9.15,9.36,9.45,9.30,9.24,试用指数平滑法预测12月份的门诊收入。;例题10-3:某医院某科室2012年1月至11月的门诊收入依次为9.03,9.06,9.12,8.73,8.94,9.30,9.15,9.36,9.45,9.30,9.24,试用指数平滑法预测12月份的门诊收入。;确定性时间序列模型:指数平滑法;;时间序列基本模型——随机性时间序列模型;随机性时间序列模型:时间序列的随机性和平稳性;;;;;;;;;;随机性时间序列模型:平稳时间序列模型;;;;;随机性时间序列模型:非平稳时间序列模型;;;;;;;;;;;例题10-4:表10-9记录了1975-2006年某市居民糖尿病患者的死亡率(死亡率单位:1/10万),请用随机性时间序列模型预测2007-2016年糖尿病患者的死亡率。

;例题10-4:表10-9记录了1975-2006年某市居民糖尿病患者的死亡率(死亡率单位:1/10万),请用随机性时间序列模型预测2007-2016年糖尿病患者的死亡率。

结果如下:

;;;

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档