- 1、本文档共196页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第06章_聚类分析,聚类分析,聚类分析案例,spss聚类分析,聚类分析法,spss聚类分析步骤,spss聚类分析案例,模糊聚类分析,matlab聚类分析,聚类分析原理
* * * 例 6.9(续例 5.2) 对例5.2的数据进行快速聚类分析(27个省市区的编号如例6.5所示),按下列情况分析: (1)分为2类; (2)分为4类。 * 分为2类 data pjxf; input x1-x8; cards; …… ; proc fastclus data=pjxf out=a1 maxc=2 distance list; run; * * * * 分为4类 * * * * 用Lm距离进行快速聚类 上面我们介绍的聚类方法都是用欧氏距离。下面我们介绍用Lm距离进行快速聚类的方法。 设 ,则其Lm距离为 当 时,即是欧氏距离,当 时,为绝对距 离: * 用Lm距离进行快速聚类 我们先讨论L1的情况。 对于一元数据 ,要求一个数c,使得 可知,使上式达到最小的c是 的中位数 * 用Lm距离进行快速聚类 对于p元样品 。其中 的第k个分量的数据集是 ,设它的中位数是 ,则 称为 的中位向量,其中 满足 * 用Lm距离进行快速聚类 从而 * 用Lm距离进行快速聚类 讨论Lm最优化准则。对于一元数据 ,要求有一个数c,使得 称c为 的m中心。对于p元样品 , 其中 * 用Lm距离进行快速聚类 的第k个分量的数据集是 ,设它的m中心是 ,则 称为 的m中心向量,其中 满足 从而 * 用Lm距离进行快速聚类 2中心向量即均值向量,1中心向量即中位向量 在采用Lm距离进行快速聚类分析时,最终聚点应是每一类的m中心向量。在采用L1距离进行聚类分析时,最终聚点应是每一类的中位向量 用L1距离进行聚类分析时,有较强的稳健性,当有异常数据时,分类结果经常会更好些 采用不同的Lm距离,聚类分析的结果经常会是不同的 * 例 6.10(续例6.7) 利用绝对距离对例6.7的数据进行快速聚类。 * * * * 例 6.11(续例6.8) 利用绝对距离对例6.8的数据进行快速聚类。 (1)分为3类; (2)分为4类。 * 例 6.11(续例6.8) 利用绝对距离对例6.8的数据进行快速聚类。 (1)分为3类; (2)分为4类。 * * * * * * 快速聚类法 选择聚点 最终分类 合理 初始分类 分类是否合理 修改分类 不合理 * 快速聚类法的步骤 1 选择聚点 聚点(种子)是一批有代表性的样品,它的选择 决定了初始分类,对最终分类有较大影响。 在进行快速聚类法前,要根据研究问题的要求及 了解程度先定下分类数k,这样就可以在每一类中选 择一个有代表性的样品作为聚点(初始聚点)。 * 快速聚类法的步骤 1 选择聚点 选择聚点有下列方法: 1)经验选择。如果对研究对象比较了解,根据以 往的经验定下k个样品作为聚点。 2)将n个样品人为地(或随机地)分成k类,以 每类的重心作为聚点。 * 快速聚类法的步骤 1 选择聚点 3)最小最大原则。设要将n个样品分成k类,先 选择所有样品中距离最远的两个样品 为前两个聚 点,即选择 和 ,使 然后,选择第3个聚点 ,使得 与前两个聚点的距 离最小者等于所有其余的与 的较小距离中最大 的,用公式表示为 * 快速聚类法的步骤 然后按相同的原则选取 ,依次下去,直至选定k个 聚点 。 若已选了l个聚点(lk),则第l+1个聚点选取的原 则为 * 快速聚类法的步骤 注:在SAS系统proc fastclus过程中,分类数k是事先 给定的。在给定k以后, proc fastclus过程会按上述方 法算出初始聚点的。 * 快速聚类法的计算步骤 先假设聚类中采用的距离是欧式距离,即 1)设k个初始聚点的集合是 用下列原则实现初始分类。记 这样,将样品分成不相交的k类。以上初始分类的原 则是每个样品以最靠近的初始聚点归类。 * 快速聚类法的计算步骤 依照以上计
您可能关注的文档
- 水质工程学课程设计1计算书.doc
- 水厂单体调试方案.doc
- 色谱分析样品前处理.ppt
- 偏紫的人物照片较色及美化处理.pdf
- 宾馆污水处理与回用工程简1.doc
- 色谱分析样品前处理技术(邱月明).ppt
- 27第二十七章 内插法.pdf
- 形貌分析-SEM.ppt
- (水稳)压实度检测记录(灌砂法).xls
- 红外光谱样品调制及图谱解析技巧.ppt
- 中国行业标准 DB/T 100-2024区域性地震安全性评价.pdf
- 《GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架》.pdf
- GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- DB/T 100-2024区域性地震安全性评价.pdf
- 中国行业标准 GM/T 0138-2024C-V2X车联网证书策略与认证业务声明框架.pdf
- 校园周边书店阅读氛围对初中生阅读素养提升的影响研究教学研究课题报告.docx
- 初中校园餐饮卫生监管与食品安全教育创新模式研究教学研究课题报告.docx
- 《文化遗产保护与旅游开发平衡机制的法律法规完善研究》教学研究课题报告.docx
- 《农作物病虫害生物防治技术的经济效益与社会影响分析》教学研究课题报告.docx
- 1 剖宫产术后子宫瘢痕憩室治疗中的并发症预防与护理措施教学研究课题报告.docx
最近下载
- 药事管理学药品注册管理课件.ppt VIP
- 《肩袖损伤与肩周炎》课件.ppt VIP
- 2024年重庆市巴蜀中学初升高自主招生语文试卷真题(含答案).docx VIP
- 中介新房培训课件内容.ppt VIP
- 2024年重庆渝中区重庆市巴蜀中学自主招生数学试卷(初升高保送)(详解版).pdf VIP
- 2025年西藏自治区公务员录用考试面试真题试卷(结构化小组)题型分析.docx VIP
- 药品注册管理课件.ppt VIP
- 击剑基础理论知识单选题100道及答案解析.docx VIP
- 《未成年人保护法》课件ppt.pptx VIP
- (高清版)B-T 19363.1-2022 翻译服务 第1部分:笔译服务要求.pdf VIP
文档评论(0)