- 4
- 0
- 约5.95千字
- 约 82页
- 2018-02-09 发布于天津
- 举报
第一节 聚类分析
第二节 主成分分析; ;把“对象”分成不同的类别
这些类不是事先给定的,而是直接根据数据的特征确定的;
把相似的东西放在一起,从而使得类别内部的“差异”尽可能小,而类别之间的“差异”尽可能大;
聚类分析就是按照对象之间的“相似”程度把对象进行分类。;聚类分析的“对象”可以是所观察的多个样本,也可以是针对每个样本测得的多个变量;
按照变量对所观察的样本进行分类称为Q型聚类
按照多项指标(变量)对不同的地区(样本)进行分类;
按照样本对多个变量进行分类,则称为R型聚类
按照不同地区的样本数据对多个变量进行分类;
两种聚类没有什么本质区别,实际中人们更感兴趣的通常是根据变量对样本进行分类(Q型聚类)。;按对象的“相似”程度分类;
根据样本的观测数据测度变量之间的相似性程度可以使用夹角余弦、Pearson相关系数等工具,也称为相似系数;
变量间的相似系数越大,说明它们越相近;
根据变量来测度样本之间的相似程度则使用“距离”;
把离得比较近的归为一类,而离得比较远的放在不同的类;;二、相似性的度量;聚类分析中是用“距离”或“相似系数”来度量对象之间的相似性;
31个地区的PM 2.5 数据就是直线上的31个点,每一个点对应一个地区;
如果按照PM 2.5对它们进行分类,就可以把在直线上离得比较近的那些点归为一类。如果再考虑太阳辐射,那么PM 2.5和太阳辐射就
您可能关注的文档
- 隧道工程第八章不良地质隧道施工资料.ppt
- 隧道工程第二章隧道工程地质环境及围岩分级资料.ppt
- 隧道工程第九章隧道掘进机TBM施工资料.ppt
- 隧道工程第六章隧道施工方法演示.ppt
- 隧道工程第三章隧道线路及断面设计)资料.ppt
- 隧道工程第三章隧道线路及断面设计说明.ppt
- 隧道工程第四章隧道结构构造资料.ppt
- 隧道工程试验检测技术一资料.ppt
- 隧道火灾对衬砌混凝土耐久研究探讨.ppt
- 隧道开挖建模培训幻灯片文稿.ppt
- (2026)医院评审筹备与科室标准化建设工作总结(2篇).docx
- 2026年资质年检自查报告(2篇).docx
- 2026水库自查报告(2篇).docx
- 2026年北师大版适配小升初历史寒假衔接卷重大事件因果分析标准试卷第473套(含答案解析与可打印作答区).docx
- 河北唐山市2026年高三下学期第一次模拟演练物理试卷(解析版).pdf
- 六年级上册Unit 2物理练习:第2课时单词拼写与选择题.pdf
- 湖北省襄阳市第四中学2025-2026学年高三上学期教学质量检测(二)物理(II)试题(解析版).pdf
- 湖北省随州市六校2026年高三下学期一模物理试题(解析版).pdf
- 湖北省襄阳市枣阳二中2025-2026学年高三上学期一模物理试题(解析版).pdf
- 湖北省襄阳市枣阳二中2025-2026学年高三上学期一模物理试题(解析版).docx
原创力文档

文档评论(0)