- 1、本文档共135页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元统计分及spss实现
多元统计分析及spss实现 数理部 任铭 多元统计分析方法从研究问题的角度可以分为不同的类,相应有具体解决问题的方法。 多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。 本讲重点介绍常用的统计方法。这些方法包括聚类分析、主成分分析、因子分析、判别分析、对应分析、典型相关分析、方差分析、回归分析等。 典型统计赛题:葡萄酒评价(2012年A题) 葡萄酒评价(2012年A题) 内容提纲 1、数据处理 2、描述性统计 3、聚类分析 4、主成分分析 5、因子分析 6、判别分析 7、方差分析 8、回归分析 一、数据处理 SPSS界面介绍 建立数据文件 制图 一、数据处理——SPSS界面介绍 数据编辑窗口 一、数据处理——SPSS界面介绍 结果编辑窗口 一、数据处理——建立数据文件 定义变量 数据录入 数据文件的保存 数据编辑 调用其它数据文件 一、数据处理——建立数据文件:定义变量 一、数据处理——建立数据文件:定义变量 一、数据处理——建立数据文件:数据录入 直接录入 调入数据:excel、记事本等 一、数据处理——建立数据文件:保存 选择“File”菜单的“Save”命令,可直接保存为SPSS默认的数据文件格式(*.sav)。 选择“File”菜单的“Save As”命令,弹出“Save Data As”对话框,可选择保存为Excel(*.xls)等文件格式。 一、数据处理——建立数据文件:数据编辑 (1)数据的排序: 数据→排序个案… 数据→排列变量… (2)数据的转置: 数据→转置… 分割文件、重组、选择个案等 一、数据处理——制图 主要通过“Graph”菜单中的选项来创建图形 二、描述性统计 例2.1:数据2.1给出了员工代码、性别、起始薪金、当前薪金等信息: 1.利用频率计算当前薪金的描述性统计量,并绘制 带正态检验的直方图; 2.利用探索性分析不同性别员工当前薪金情况; 3.用比率分析比较不同性别员工的薪金增长率是否 有较大差异; 4.用P-P图和Q-Q图检验当前薪金是否符合正态分布 二、描述性统计 二、描述性统计 二、描述性统计 2.利用探索性分析不同性别员工当前薪金情况 二、描述性统计 2.利用探索性分析不同性别员工当前薪金情况 二、描述性统计 3.用比率分析比较不同性别员工的薪金增长率是否 有较大差异 二、描述性统计 二、描述性统计 4.用P-P图和Q-Q图检验当前薪金是否符合正态分布 三、聚类分析——聚类分析的概念及分类 聚类分析就是分析如何对样品(或变量)进行量化分类的问题。 通常聚类分析分为Q型聚类和R型聚类。 Q型聚类是对样品进行分类处理; R型聚类是对变量进行分类处理。 三、聚类分析——相似性度量 在聚类之前,要首先分析样品(变量)间的相似性。 样品相似性度量(距离):即两个样品间相似程度就可用p维空间中的两点距离公式来度量。 变量相似性度量(夹角余弦、相关系数) 相对于数据的大小,我们更关心变量的方向及相关性 三、聚类分析——相似性度量 几种距离 三、聚类分析——相似性度量 三、聚类分析——相似性度量 三、聚类分析——相似性度量 三、聚类分析——相似性度量 无论是夹角余弦还是相关系数,它们的绝对值都小于1,作为变量近似性的度量工具,我们把它们统记为cij。 当∣cij∣= 1时,说明变量Xi与Xj完全相似; 当∣cij∣近似于1时,说明变量Xi与Xj非常密切; 当∣cij∣ = 0时,说明变量Xi与Xj完全不一样; 当∣cij∣近似于0时,说明变量Xi与Xj差别很大。 据此,我们把比较相似的变量聚为一类,把不太相似的变量归到不同的类内。在实际聚类过程中,为了计算方便,我们把变量间相似性的度量公式作一个变换为 dij = 1 ? ∣cij∣ 或者 dij2 = 1 ? cij2 来表示变量间的距离远近,小则先聚成一类,这比较符合人们的一般思维习惯。 三、聚类分析——常见聚类方法 A)系统聚类法 B)K均值聚类法 三、聚类分析——常见聚类方法 A)系统聚类法 系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 系统聚类过程是:假设总共有n个样品(或变量),第一步将每个样品(或变量)独自聚成一类,共有n类;第二步根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其它的样品(或变量)仍各自聚为一类,
文档评论(0)