- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析的SPSS实现PPT
(2)判别函数系数 在Fuction coefficients组的矩形框中选择判别函数系数的输出形式: ①Fishers可以直接用于对新样本进行判别分类的费雪系数。 ②Unstandardized未经标准化处理的判别系数。可用于计算判别分数。 K-Means Cluster原理 首先,选择n个数值型变量参与聚类分析,最后要求的聚类数为k个; 其次,由系统选择k个(聚类的类数)观测量(也可由用户指定)作为聚类的种子。 第三,按照距离这些类中心的距离最小的原则把所有观测量(样品)分派到各类重心所在的类中去。 第四,这样每类中可能由若干个样品,计算每个类中各个变量的均值,以此作为第二次迭代的中心; 第五,然后根据这个中心重复第三、第四步,直到中心的迭代标准达到要求时,聚类过程结束。 K-Means Cluster聚类过程 由Analyze——Classify ——K-Means Cluster 将个变量放入Variable ; 输入最后聚类的个数; 例 饮料数据(spssex/drink.sav ) 16种饮料的热量、咖啡因、钠及价格四种变量 快速聚类 选项 读写凝聚点 人为固定分类数 ANOVA表, 初始凝聚点等 快速聚类法的聚类数由用户指定,分类是唯一的。 1.分类数:如希望聚成K类 2.聚类方法:method: iterate and clussify(聚类分析的 clussify only(聚类分析过程类中心 3.聚类中心:centers 4.迭代次数:iterate 5.保存分类结果:save 每一步都重新计算新的类中心点) 点始终为初始类中心点,仅作一次迭代) Initial Cluster Center:快速聚类的初始类中心点(本例由系统自行指定四个类的初始类中心点) 指定聚成四类 Iteration History:快速聚类的迭代步骤 在迭代过程中,完成第一次迭代后形成的四个新类中心点距初始类中心点的欧氏距离分别为5.065、12.532、12.275、25.901。第四次迭代后形成的四个新类中心点几乎与上次确定的中心点没有差别。经过四次迭代,快速聚类完成。 快速聚类的最终类中心点 Number of Cases in each Cluster:快速聚 类的最终结果 快速聚类的类成员情况 各样本距其所在的类中心的欧氏距离 各类中的成员数 判别分析的 SPSS实现 SPSS提供的建立判别函数的方法有: 1.全模型法:把所有的变量放入判别函数中 2.逐步判别法 判别分析的步骤 对于分为m类的研究对象,建立m个线性判别函数,对测试的样本代入判别函数,得出判别得分,从而确定该样本属于哪一类。 Discriminant Discriminant对话框 Grouping Variable:已知的观测量所属类别的变量(分类变量) Independents:观测量,即参与判别分析的变量。 Use Stepwise method :当不认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。因此根据对判别贡献的大小进行选择。 Enter independent together :当所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析,建立全模型。不需要进一步进行选择。 选择分类变量及其范围 在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量,按上面一个箭头按钮,使该变量名移到箭头按钮右面,“Grouping Variable”下面的矩形框此时矩形框下面的“Define range…”按钮加亮,按该按钮,屏幕显示一个小对话框,供指定该分类变量的数值范围。定义分类变量范围的小对话框如下图 所示。 在Minimum:后面的矩形框中输入该分类变量的最小值;在Muximurn:后面的矩形框中输入该分类变量的最大值。 分类变量范围对话框 2 指定判别分析的自变量 在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮,把选中的变量移到“Independents:”下面的矩形框中,作为参与判别分析的变量。 Indepents对话框 数据变量输入框 数据判别分析 完成前面四步骤的操作即可使用各种系统默认值对工作数据集的数据进行判别分析了。可以使用的方法有两种: (1)直接运行:在主对话框中按(用鼠标单击)Ok按钮 (2)生成SPSS命令程序后再运行:在主对话框中按Paste按钮,激活Syntax窗,在该窗中按Run按钮执行该语句窗中的程序。
文档评论(0)