4.3.2因子分析的过程.ppt

下载文档 降价啦

0
0
约6.86千字
约 43页
2018-12-06 发布于北京
举报
版权申诉
保障服务

4.3.2因子分析的过程.ppt

1、本文档共43页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

4.3.2因子分析的过程.ppt

?Iterate and classify??默认选项。表示聚类过程中选择或指定初始类中心点，按照K-means?的迭代算法不断调整类中心点。 Classify only??聚类过程中只使用初始的类中心点而不做调整，迭代次数也进行一次。 Convergence Criterion：K-Means?算法的收敛准则，输入范围在0~1之间，且不等于1。默认值为0。若输入数值为0.01，表示两次迭代计算的最小类中心的变化距离小于初始类中心距离的1%时迭代停止。 Use running means：选择该项，表示在每个个案被分配到一类后立即计算新的类中心；反之，则在完成了所有个案的一次分配后，再计算各类的类中心。注意，对于大数据样本，选择该项会大大增加计算量和计算时间。 ANOVA table，该方差分析是以聚类分析产生的类为控制变量的单因素方差分析，并输出各变量的方差分析表。 Exclude cases listwise??将带有缺失值的个案从分析中剔除。 Exclude cases pairwise??只有当个案的所有聚类变量值全部缺失时，才将其从分析中剔除，否则根据所有其他非缺失变量值，将其分配至最接近的一类中。二阶段聚类基本原理可处理分类变量和连续型变量。综合处理多项-正态分布的数据。自动确定最优聚类数，有效地分析大样本。 step1 构建聚类特征树；step2 使用聚集聚类法对聚类特征树的结点进行分组，产生不同聚类数的指标，比较Schwarz-Bayesian或Akaike信息准则确定最优类数。数据文件 cluster4.sav，保存的是157个各种不同车型的数据。包括汽车生产厂家、汽车型号、各种型号汽车的销售额、价格和燃油效率等相关数据。要求对这157个不同型号的汽车，用二阶段聚类分析方法进行分类。 “Analyze”→“Classify”→“TwoStep Cluster” * * 选定变量列表中参与运算的变量，按数据类型分别移动到“Categorical Variables”窗口和“Continuous Variables”窗口；在“Distance Measure”（距离测度）部分确定聚类相似性计算方式；在“Number of Clusters”（聚类数）部分指定聚类分析中聚类数的确定方式。既可以选定“Determine automatically”（系统自动确定聚类数），也可以使用“Specify fixed”（固定聚类数），指定一个正整数作为聚类数；此外，如果是希望系统确定聚类数目，还需要在“Clustering Criterion”（聚类准则）部分选定确定聚类数目的算法，使用“Schwarz’s Bayesian Criterion（BIC）”?即贝叶斯信息准则或“Akaike’s Information Criterion（AIC）”即Akaike信息准则。 * * * * 对聚类结果的输出进行设置 ?Create cluster membership variable?（创建聚类成员变量）表示将在工作数据文件中创建名为tsc_n的新变量，以保存每一个观测量所属的分类。同时，也可以在这个子对话框中指定将聚类模型及聚类特征树输出到不同的XML格式文件中。 * * 二阶聚类分析的结果主要通过“聚类浏览器”来查看聚类浏览器包含左右两个面板，主视图位于左侧，链接或辅助视图位于右侧。主视图包括模型摘要和聚类视图，链接/辅助视图包括预测变量的重要性、聚类大小、单元格分布和聚类比较四种。聚类视图。在左侧主面板下方单击“View”右侧的下拉列表，从中选择“Clusters”，即可看到聚类视图，其中包含了每个聚类的名称、大小和概要。 * * 聚类预测变量重要性视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框，从中选择“Predictor Importance”，即可切换到“聚类预测变量重要性视图”，该视图显示评估模型时每个变量的相对重要性。 * * 聚类大小视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框，从中选择“Cluster Sizes”，即可切换到“聚类大小视图”。该视图显示每个聚类的饼图。并在每个分区上显示每个聚类占总数的百分比。 * * 单元格分布视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框，从中选择“Cell Distribution”，切换到“单元格分布视图”，如没有显示出对应的视图，可在聚类视图中单击表格中的某一个单元格，则可看到相应的单元格分布视图。 * * 聚类比较视图。单击“聚类浏览器”右侧面板下方“View”右侧的下拉列表框，从中选择 “Cluster Comparison”，然后在左侧选择“聚类”主面板中聚类列的顶部（按住Ctrl