2015信息分类方法.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6、信息分类方法 ——因子分析与聚类分析 补充:相关系数 皮尔逊相关系数 r(X,Y)= = = 补充:常用的聚类方法 扩展:MDS MDS,多维尺度分析, 多维尺度分析(Multidimensional Scaling analysis, 简称MDS)处理的是表示变量亲近性的数据(Proximity data)。 MDS的目的是寻找决定多个变量的少数几个变量,并在低维空间内以图形的形式表现出来。多维尺度法可依其输入(input)及输出(output)数据是计量(metric,比率和等距数据)或非计量(non-metric,定序和属性数据)可分为三类:完全计量多维尺度法(输入数据与输出结果都是计量);完全非计量多维尺度法(输入数据与输出结果都是非计量);非计量多维尺度法(输入数据是非计量但输出结果为计量的)。 在SPSS中提供了两种程序可以完成多维尺度分析,分别被命名为“Multidimensional Scaling”和“Multidimensional Scaling(PROXSCAL)”。在“Multidimensional Scaling”中输入数据被假定为非相似性数据,即两个研究对象之间的数值越大说明越不相似。对于相似性数据,通过“Create distances from data”则可以实现将相似性数据转化为非相似性数据的目的。该程序产生的结果有两个非常重要的参数来考察结果的优劣性(即拟合优度)。一是Stress(压力系数),一是RSQ(Stress and squared correlation)。Stress越小约好,而RSQ越大约好。一般Stress≤0.2,RSQ≥0.6时,结果可以接受。 在“Multidimensional Scaling(PROXSCAL)”中输入数据的类型可以选择,比较灵活,既可以选择相似性数据,也可以选择非相似性数据。该程序产生的一个非常重要的参数是Normalized Raw Stre和Dispersion Accounted For(D.A.F.),Normalized Raw Stress该参数越小越好,D.A.F.相当于RSQ,越大越好。 [1]非计量MDS在1964由J.B.Kruskal提出“压力系数(Stress)”的概念与指标后,建立起一个评估所得到图形与输入数据间的配合度(goodness of fit)优劣的标准(用poor,fair,good,excellent和perfect表示),使之更为完备。Kruskal将Stress的大小分为五级,各代表不同的配合程度。具体为:0.200表示不好(poor);0.100表示还可以(fair);0.050表示好(good);0.025表示非常好(excellent);0.000表示完美(perfect)。 [3] 至于具体小于多少并没有具体规定。 (2)样本数据的处理 考虑到各指标数据的差异以及使得分析结果更加有效,首先将样本数据进行标准化处理,处理后的数据消除了量纲之间的差异。 保存在文件“西部地区人口素质.sav”中。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. (3)利用SPSS进行因子分析 Analyze→Data reduction→Factor 输出各个分析变量的初始共同度,特征值以及解释方差的百分比 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. (4)结果分析 KMO测度值大于0.5 巴特利特球体检验值查表也可以通过 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. 因子载荷矩阵 抚养比(%) 文盲率(%) 人均受教育年数(年) 妇女平均存活子女数 平均预期寿命(岁) 高等学校数(所) 高等学校毕业生人数 专利申请受理量(件) 专利申请授权量(

文档评论(0)

5f2e576 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档