6信息分类方法.pptVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
6、信息分类方法 ——因子分析与聚类分析 补充:相关系数 皮尔逊相关系数 r(X,Y)= = = 补充:常用的聚类方法 扩展:MDS MDS,多维尺度分析, 多维尺度分析(Multidimensional Scaling analysis, 简称MDS)处理的是表示变量亲近性的数据(Proximity data)。 MDS的目的是寻找决定多个变量的少数几个变量,并在低维空间内以图形的形式表现出来。多维尺度法可依其输入(input)及输出(output)数据是计量(metric,比率和等距数据)或非计量(non-metric,定序和属性数据)可分为三类:完全计量多维尺度法(输入数据与输出结果都是计量);完全非计量多维尺度法(输入数据与输出结果都是非计量);非计量多维尺度法(输入数据是非计量但输出结果为计量的)。 在SPSS中提供了两种程序可以完成多维尺度分析,分别被命名为“Multidimensional Scaling”和“Multidimensional Scaling(PROXSCAL)”。在“Multidimensional Scaling”中输入数据被假定为非相似性数据,即两个研究对象之间的数值越大说明越不相似。对于相似性数据,通过“Create distances from data”则可以实现将相似性数据转化为非相似性数据的目的。该程序产生的结果有两个非常重要的参数来考察结果的优劣性(即拟合优度)。一是Stress(压力系数),一是RSQ(Stress and squared correlation)。Stress越小约好,而RSQ越大约好。一般Stress≤0.2,RSQ≥0.6时,结果可以接受。 在“Multidimensional Scaling(PROXSCAL)”中输入数据的类型可以选择,比较灵活,既可以选择相似性数据,也可以选择非相似性数据。该程序产生的一个非常重要的参数是Normalized Raw Stre和Dispersion Accounted For(D.A.F.),Normalized Raw Stress该参数越小越好,D.A.F.相当于RSQ,越大越好。 [1]非计量MDS在1964由J.B.Kruskal提出“压力系数(Stress)”的概念与指标后,建立起一个评估所得到图形与输入数据间的配合度(goodness of fit)优劣的标准(用poor,fair,good,excellent和perfect表示),使之更为完备。Kruskal将Stress的大小分为五级,各代表不同的配合程度。具体为:0.200表示不好(poor);0.100表示还可以(fair);0.050表示好(good);0.025表示非常好(excellent);0.000表示完美(perfect)。 [3] 至于具体小于多少并没有具体规定。 (2)样本数据的处理 考虑到各指标数据的差异以及使得分析结果更加有效,首先将样本数据进行标准化处理,处理后的数据消除了量纲之间的差异。 保存在文件“西部地区人口素质.sav”中。 (3)利用SPSS进行因子分析 Analyze→Data reduction→Factor 输出各个分析变量的初始共同度,特征值以及解释方差的百分比 (4)结果分析 KMO测度值大于0.5 巴特利特球体检验值查表也可以通过 因子载荷矩阵 Component 1 2 3 抚养比(%) -.489 .419 .676 文盲率(%) -.724 .595 -.277 人均受教育年数(年) .624 -.714 .243 妇女平均存活子女数 -.410 -.147 .848 平均预期寿命(岁) .782 -.436 -.115 高等学校数(所) .886 .284 .316 高等学校毕业生人数 .909 .292 .136 专利申请受理量(件) .921 .307 -.060 专利申请授权量(件) .920 .326 -.069 教育经费(万元) .916 .287 .143 旋转后的因子载荷矩阵 Component 1 2 3 抚养比(%) -.042 -.423 .832 文盲率(%) -.323 -.923 .014 人均受教育年数(年) .170 .964 -.030 妇女平均存活子女数 -.251 .130 .910 平均预期寿命(岁) .381 .721 -.387 高等学校数(所) .940 .279 .069 高等学校毕业生人数 .927 .239 -.108 专利申请受理量(件) .908 .185 -.296 专利申请授权量(件) .915 .165 -.303 教育经费(万元) .932 .249

文档评论(0)

qbjzmxj5904 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档