数学建模讲座-多元统计分析课件.pptVIP

下载本文档

6
0
约3.04万字
约 186页
2016-05-27 发布于广东
举报
版权申诉

数学建模讲座-多元统计分析课件.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数学建模讲座-多元统计分析课件.ppt

K-means快速聚类 (二)思路 1.指定最后要聚成K类 2.用户指定k个样本作为初始类中心或系统自动确定k个样本作为初始类中心 3.系统按照距k个中心距离最近的原则把每个样本分派到各中心所在的类中去,形成一个新的k类，完成一次迭代 4.重新计算k个类的类中心(计算每类各变量的均值,以均值点作为类中心) 5.重复3步和4步，直到达到指定的迭代次数或达到终止迭代的条件 K-means快速聚类 (二)思路 SPSS中两个判断聚类是否结束的条件,满足其中一个即可结束聚类过程. 达到指定迭代次数(maximum iteration),默认10次。收敛标准(convergence),默认0.02，即：本次迭代产生的任意新类,各中心位置变化较小.其中最大的变化率小于2%. K-means快速聚类 (三)基本操作步骤 A.菜单选项:analyze-classify-k means cluster B.选定参加快速聚类分析的变量到variables框 C.确定快速聚类的类数(number of clusters).类数应小于个案总数 D.选择聚类方法(method)：默认iterate and classify，即：在聚类的每一步都重新计算新的类中心 E.确定聚类终止条件（iterate) K-means快速聚类 (四)其他 1. 保存快速聚类的结果(save) cluster membership:将各个案所属类的类号保存到qcl_1变量中 distance from cluster center:将各样本距所属类中心的距离保存到qcl_2变量中. K-means快速聚类 (四)其他 2.输出选项(option) initial cluster centers:输出初始类中心点 ANOVA table:输出各类的方差分析表 cluster information for each case:输出每个样本的分类结果和距离 K-means快速聚类 (四)其他 3. use running means项: 选中：表示每个样本被分配到一类后立即计算新的类中心。聚类结果与个案的先后次序有关. 不选中：表示完成了所有个案的依次分配后再计算类中心.省时. K-means快速聚类 (四)其他 4.用户指定类中心(center) read initial from:若不指定则系统自动确定初始类中心。指定则从某.sav文件中读入初始类中心数据（应设一个名为Cluster_的变量名）。 Write final as:在分析的最后将各类中心写入某.sav文件因子分析因子分析的提出为尽可能完整描述一个事物，往往要收集它的许多指标多指标产生的问题：计算处理麻烦信息重叠从众多的指标中剔除一些指标又会造成信息丢失因子分析的基本思想因子分析的基本出发点将原始指标综合成较少的指标，这些指标能够反映原始指标的绝大部分信息（方差）这些综合指标之间没有相关性因子变量的特点这些综合指标称为因子变量，是原变量的重造个数远远少于原变量个数，但可反映原变量的绝大部分方差不相关性可命名解释性因子分析的基本步骤确认待分析的原始变量是否适合作因子分析构造因子变量利用旋转方法使因子变量具有可解释性计算每个样本的因子变量得分因子分析的数学模型数学模型（xi为标准化的原始变量；Fi为因子变量；kp）也可以矩阵的形式表示为： X=AF+ε F：因子变量 A：因子载荷阵 aij: 因子载荷 ε: 特殊因子因子分析的相关概念因子载荷在因子变量不相关的条件下，aij就是第i个原始变量与第j个因子变量的相关系数。aij绝对值越大，则Xi与Fi的关系越强变量的共同度(Communality) 也称公共方差。Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和可见：Xi的共同度反应了全部因子变量对Xi总方差的解释能力因子分析的相关概念因子变量Fj的方差贡献因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和可见：因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量总方差的解释能力 Sj/p表示了第j个因子解释原所有变量总方差的比例原有变量是否适合作因子分析计算原有变量的相关系数矩阵一般小于0.3就不适合作因子分析确定因子变量--主成份分析主成份分析法的数学模型：该方程组要求：将原有的P个相关变量Xi作线性变换后转成另一组不相关的变量Yi 确定因子变量--主成分分析系数uij依照两个原则来确定 yi与yj (i≠j,i,j=1,2,3,…p)互不相关； y1是x1,x2,x3,…,xp的一切线性组合（系数满足上述方程组）中方差最大的；y2是与y1不