- 1、本文档共127页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;;;什么是聚类?;什么是聚类?;聚类和分类的区别;有监督学习;无监督学习;分类图示;聚类图示;;距离度量;距离度量;;划分方法;k均值聚类;k均值聚类;k均值聚类;k均值聚类缺陷;k-中心点聚类;k-中心点聚类;k-中心点聚类-优缺点;k-中心点聚类-优缺点;;层次聚类;层次聚类-步骤;层次聚类-距离;层次聚类-距离;当算法使用最小距离衡量簇间距离时,称为最近邻聚类算法。此外,如果当最近的簇之间的距离超过某个任意的阈值时聚类过程就会终止,则称其为单连接算法。
当一个算法使用最大距离度量簇间距离时,称为最远邻聚类算法。如果当最近簇之间的最大距离超过某个任意的阈值时聚类过程就会终止,则称其为全连接算法。;先将五个样本都分别看成是一个簇,最靠近的两个簇是3和4,因为他们具有最小的簇间距离D(3,4)=5.0
第一步:合并簇3和4,得到新的簇集合1,2,(3,4),5;第二步:更新距离矩阵:
D(1,(3,4))=min(D(1,3),D(1,4))=min(20.6,22.4)=20.6
D(2,(3,4))=min(D(2,3),D(2,4))=min(14.1,11.2)=11.2
D(5,(3,4))=min(D(3,5),D(4,5))=min(25.0,25.5)=25.0;;最小和最大度量代表了簇间距离度量的两个极端。它们趋向对离散点或噪声数据过分敏感。
使用均值距离和平均距离是对最小和最大距离之间的一种折中方法,而且可以克服离群点敏感性问题。
尽管均值距离计算简单,但是平均距离也有它的优势,因为它既能处理数值数据又能处理分类数据。;层次聚类方法尽管简单,但经常会遇到合并或分裂点选择的困难。这样的决定是非常关键的,因为一旦一组对象合并或者分裂,下一步的处理将对新生成的簇进行。(不能撤销先前步骤所做的工作)
不具有很好的可伸缩性,因为合并和分裂的决定需要检查和估算大量的对象或簇,时间复杂度为O(n2);;36;37;38;39;;;;;引子;;;;时间序列概述——分类;;;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;时间序列概述——基本分析方法;;;;时间序列的组成成分:长期趋势(SecularTrend);时间序列的组成成分:季节变动(SeasonalVariation)
;时间序列的组成成分:循环变动(CyclicalVariation)
;时间序列的组成成分:不规则变动(IrregularVariation)
;;;时间序列的分解:加法模型
;时间序列的分解:乘法模型
;时间序列的分解:加乘混合模型
;;;;;;;N期移动平均数;中心化移动平均;N的取值;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;(2).加权移动平均;(3).趋势移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:移动平均法;确定性时间序列模型:指数平滑法;确定性时间序列模型:指数平滑法;确定性时间序列模型:指数平滑法;确定性时间序列模型:指数平滑法;例题10-3:某医院某科室2012年1月至11月的门诊收入依次为9.03,9.06,9.12,8.73,8.94,9.30,9.15,9.36,9.45,9.30,9.24,试用指数平滑法预测12月份的门诊收入。;例题10-3:某医院某科室2012年1月至11月的门诊收入依次为9.03,9.06,9.12,8.73,8.94,9.30,9.15,9.36,9.45,9.30,9.24,试用指数平滑法预测12月份的门诊收入。;例题10-3:某医院某科室2012年1月至11月的门诊收入依次为9.03,9.06,9.12,8.73,8.94,9.30,9.15,9.36,9.45,9.30,9.24,试用指数平滑法预测12月份的门诊收入。;确定性时间序列模型:指数平滑法;;时间序列基本模型——随机性时间序列模型;随机性时间序列模型:时间序列的随机性和平稳性;;;;;;;;;;随机性时间序列模型:平稳时间序列模型;;;;;随机性时间序列模型:非平稳时间序列模型;;;;;;;;;;;例题10-4:表10-9记录了1975-2006年某市居民糖尿病患者的死亡率(死亡率单位:1/10万),请用随机性时间序列模型预测2007-2016年糖尿病患者的死亡率。
;例题10-4:表10-9记录了1975-2006年某市居民糖尿病患者的死亡率(死亡率单位:1/10万),请用随机性时间序列模型预测2007-2016年糖尿病患者的死亡率。
结果如下:
;;;
您可能关注的文档
- Geology Applied to Civil Engineering 土木工程地质 英文课件 第八章 Deris flow.pptx
- 医学大数据分析 课件 第1、2章 医学大数据概述、常用大数据工具.pptx
- 医学大数据分析 课件 第5、6章回归分析、 数据降维.pptx
- 医学大数据分析 课件全套 第1--14章 医学大数据概述---医学图像数据分析.pptx
- 《电机与电气控制技术》 课件 第1次课-变压器用途分类结构.pptx
- 《电机与电气控制技术》 课件 第2次课-单相变压器的运行原理.pptx
- 《电机与电气控制技术》 课件 第3次课-三相电力变压器.pptx
- 《电机与电气控制技术》 课件 第4次课-常用变压器.pptx
- 第6次课-三相异步电动机的工作原理-1.pptx
- 《电机与电气控制技术》 课件 第7次课-三相异步电动机的结构-1.pptx
最近下载
- 一种电子级硝酸的制备方法.pdf VIP
- 招标文件评分要点深度分析.docx VIP
- 电力行业集团数字化转型信息化战略规划方案.docx
- 作风建设学习教育单位自查清单(28个问题方面)+领导干部作风建设学习教育查摆问题清单(五个方面共15条).docx VIP
- 2024江苏省数据集团有限公司招聘试题及答案解析.docx
- FlyWan双口USB打印服务器安装方法.doc VIP
- 2023年03月六级真题全3套.pdf VIP
- 2024年初三中考第一次模拟考试试题:地理(安徽卷)(考试版A3).docx VIP
- 天津市部分区2022-2023学年三年级下学期语文期末试卷.pdf VIP
- 高铁客运服务案例分析报告.docx VIP
文档评论(0)