- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章聚类分析剖析
第四章 聚类分析;聚类分析与判别分析的区别
判别分析:事先已知研究对象可以分成哪几种类别。需要拥有一批事先已经知道类别的历史样本,参考这些样本建立判别函数,对某一新的样品,判断其分类。
聚类分析:事先不知道研究对象可以分成哪些类别。聚类分析要做的就是根据数学方法定量地确定这些样品之间的亲疏关系,按照相似程度来对他们进行分类。
聚类分析举例:
例如,对一批环流形势图根据它们的相似程度进行分类(这些环流形势图所造成的预报量的结果相同或未知,因此无法通过预报量对其进行分类,只能根据这些图像的相似程度来划分它们的类别,这就是聚类分析的内容)。;第四章1 相似性的度量;距离系数;(2)欧氏距离
X矩阵中两列向量xi和xj的差向量各元素的平方和的平方根。;例:已知二维正态总体G的分布为:G ~ N ( μ, V), 并且:
;图解马氏距离与欧氏距离的区别;相似性的度量;第四章2 系统聚类法;最短距离法;n个样品的最短距离聚类法的步骤:
(任选一种距离,如“欧氏距离”,作为两个样品之间的距离):;“最短距离法”聚类举例 (P114 例1);最短距离法 聚类图;最长距离法;离差平方和法;对于第g类的资料阵(m行ng列,从X中抽取ng列),可以写为Xg :;把n个样品分成k类,分法非常多,要比较所有的分法使得S最小,不太现实。
因此,只好放弃在一切分类中寻求S的极小值,提出使S达到局部极小的办法。;“离差平方和”聚类法举例;2. D(1)中G3与G4的距离最小,将G3与G4合并成G10,
目前共有三类:
G7{x1,x2}, G8{x5,x6}, G10{x3,x4}
然后计算两两之间的距离阵D(2)如右图所示:;第四章3 动态聚类法;K-均值(K-means)聚类:
固定类别的数目为k类,所以也可称为“定K-均值聚类”。;P118例3,有一组4个指标10次观测的样本数据,并已标准化(表4.6),试用定K-均值法进行聚类,把10个样品分成5类。;3. 根据样品之间最小距离的原则,对样品进行归类,;5. 把各类别的均值列向量作为新的凝聚点(初始分类),重复以上2、3步步骤,进行新的分类。;5.3 计算各类的重心(均值向量),以便作为新的凝聚点:;动K-均值聚类;动K-均值聚类的步骤:
您可能关注的文档
- 第十七届塑料博览会亮点预报剖析.pptx
- 第十七课孙悟空三打白骨精剖析.doc
- 26种提升客流的方法精选.ppt
- 第六课《滑轮组》PPT剖析.pptx
- 第十三章国际物流营销剖析.pptx
- 第十三届中国制造业管理国际论坛邀请函20160801剖析.docx
- 第十三章桂林旅游基本产业发展规划剖析.doc
- 第十七章杂环化合物剖析.doc
- 第十三讲长度和时间的测量剖析.docx
- 26科里亚的木匣精选.ppt
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)