- 1、本文档共90页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss学习第9章教程文件.ppt
Step02:选择判别分析变量 在【辨别分析】对话框左侧的候选变量中选择进行判别分析的变量将其添加至【自变量】列表框中,将其作为自变量。 Step03:指定分类变量及范围 在主对话框的候选变量中选择分类变量(离散型变量)移入【分组变量】框中。此时它下面的【定义范围】按钮加亮,按该按钮,屏幕弹出一个小对话框,提供指定该分类变量的数值范围,如图所示。 其中, ● 输入最小值: ● 输入最大值 : 9.3 SPSS 在判别分析中的应用 Step04:选择判别分析方法 在主对话框【自变量】列表框下面有两个按钮,它们提供了判别分析方法选择: ● 一起输入自变量:建立所选择的所有变量的判别式。当认为所有自变量都能对观测量特性提供丰富的信息时使用该选择项。系统默认设置。 ● 使用步进式方法:采用逐步判别法作判别分析。点选该项后,主菜单中的【方法】按钮加亮。可以进一步选择判别分析方法(见第 步)。 如果希望使用一部分观测量进行判别函数的推导,选择一个能够标记需选择的这部分观测量的变量将其移入【选择变量】框中;再单击其右侧的Valve按钮,展开【设置值】对话框,键入能标记的变量值,如图所示。 9.3 SPSS 在判别分析中的应用 K-均值聚类法又叫快速聚类法,可以用于大量数据进行聚类分析的情形。它是一种非分层的聚类方法。这种方法占用内存少、计算量、处理速度快,特别适合大样本的聚类分析。它的基本操作步骤如下: 1、指定聚类数目k,应由用户指定需要聚成多少类,最终也只能输出关于它的唯一解。这点不同于层次聚类。 2、确定k个初始类的中心。两种方式:一种是用户指定方式,二是根据数据本身结构的中心初步确定每个类别的原始中心点。 3、根据距离最近原则进行分类。逐一计算每一记录到各个中心点的距离,把各个记录按照距离最近的原则归入各个类别,并计算新形成类别的中心点 4、按照新的中心位置,重新计算每一记录距离新的类别中心点的距离,并重新进行归类。 5、重复步骤4,直到达到一定的收敛标准。 这种方法也常称为逐步聚类分析,即先把被聚对象进行初始分类,然后逐步调整,得到最终分类。 9.2 SPSS 在聚类分析中的应用 9.2.2 快速聚类SPSS操作详解 Step01:打开主菜单 选择主菜单中的【分析】→【分类】→【K均值聚类】命令,弹出【K均值聚类分析】对话框,如图所示,这是快速聚类分析的主操作窗口。 9.2 SPSS 在聚类分析中的应用 Step02:选择聚类分析变量 在【K均值聚类分析】对话框左侧的候选变量中选择进行聚类分析的变量将其添加至【变量】列表框中。同时可以选择一个标识变量移入【个案标记依据】框中。 Step03:确定分类个数 【聚类数】框中,可以输入确定的聚类分析数目,用户可以根据需要自行修改调整。系统默认的聚类数为2. Step04:选择聚类方法 主对话框中的【方法】栏中可以选择聚类方法。系统默认值是【迭代与分类】项。 ● 选择初始类中心:在迭代过程中不断更新聚类中心。把观测量分派到与之最近的以类中心为标志的类中去。 ● 只使用初始类中心对观测量进行分类,聚类中心始终不变。 9.2 SPSS 在聚类分析中的应用 Step05:聚类中心的输入与输出 在主对话框图中,【聚类中心】栏表示输入和输出聚类中心的对话框。用户可以指定外部文件或数据集作为初始聚类中心点,也可以将聚类分析的聚类中心结果输出到指定文件或数据集中。 ● 要求使用指定数据文件中的观测量或建立数据集作为初始类中心。 ● 要求把聚类结果中的各类中心数据保存到指定的文件或数据集中。 9.2 SPSS 在聚类分析中的应用 在主对话框中单击【迭代】按钮,打开设置迭代参数的对话框图,这里可以进一步选择迭代参数。 9.2 SPSS 在聚类分析中的应用 Step07:输出聚类结果 在主对话框中单击【保存】按钮,弹出【保存新变量】对话框,它用于选择保存新变量,见图 ● 聚类成员:在当前数据文件中建立一个名为“qcl_1”新变量。其值表示聚类结果,即各观测量被分配到哪一类。它的取值为1、2、3…的序号。 ● 与聚类中心的距离:在当前数据文件中建立一个名为“qcl_2”新变量。其值为各观测量与所属类中心之间的欧氏距离。 9.2 SPSS 在聚类分析中的应用 Step08:其他选项输出 在主对话框中单击【选项】按钮,弹出【选项】对话框,它用于指定要计算的统计量和对带有缺失值的观测量的处理方式。具体见图 : ①【统计量】栏选择输出统计量 ● 初始聚类中心: ● 方差分析表: ●显示每个观测量的聚类信息: ②【缺失值】栏中选择处理缺失值方法 ● 按列表排除个案:分析变量中带有缺失值的观测量都不参与后
文档评论(0)