- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十四章 对应分析法
本章导读
在上一章我们了解了如何分析列联表中各个变量之间的关系,但是通过对列联表进行 检验,只能检验测出行变量与列变量之间是否存在显著的依存关系,而无法判断具体的行变量与列变量的各自的水平之间的关系,该如何解决这个问题?本章将为读者介绍一种更加实用的方法——对应分析,进一步帮助读者研究定性变量之间的具体关系。
案例导入
出游方式的选择与经常使用的车型存在怎样的对应关系
第一节 对应分析的原理与步骤
一、对应分析的概念
Correspondence Analysis,又称为R→Q型因子分析,最早由法国统计学家J.P.Beozecri于1970年提出,是在Q型和R型因子分析的基础上发展起来的一种多元统计分析方法。
对应分析通过分析由定性变量构成的列联表来揭示变量间的联系,可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。
对应分析是一种视觉化的数据分析方法,它能够将几组看不出任何联系的数据,通过视觉上可以接受的定位图展现出来。对应分析最大的特点是能把众多的样品和众多的变量同时放到同一张图解上,将样品的大类及其属性在图形上直观而又明了地表示出来。
1)显示不同行内某一列的类别的异同;
2)显示不同列内某一行的类别的异同;
3)显示行与列的关系。
二、对应分析的基本思想
(一)对应分析与列联分析
对列联表数据进行对应分析一般需要两个前提条件:
1)列联表行变量与列变量之间关系显著;
2)列联表行变量与列变量水平较多,关系相对复杂。
总惯量I(Inertia),与列联表的Pearson 卡方检验建立了联系
惯量用于说明对应分析各个维度的结果能够解释列联表中两个变量联系的程度,惯量的平方根称为奇异值(Singular Value)。
(二)对应分析与因子分析
总惯量可视为一种相关系数,它度量了行变量X与列变量Y之间的相关程度。
对应分析把总惯量I分解成几个部分,也就是将总惯量I对变量X和Y相关程度的度量分解为几个部分,可以通过计算惯量比例进行主次顺序的排列。
惯量比例类似于因子分析中公因子解释能力的说明,可以根据累计惯量的比例确定降维后的维数(一般取前两组)
与因子分析不同的是,因子分析要求数据为间隔数据或比率数据等定量数据,而且观测数目必须是观测变量的5倍以上,它只能分别地对指标或样品进行分类。而对应分析接纳名义变量。
对应分析克服了因子分析的不足,把Q型和R型因子分析统一起来,建立了某种内在的联系,把轴的一张图上,借以解释行变量与列变量之间的对应关系列变量与行变量同时反映到具有相同因子。
对应分析的实质就是将一个列联表的行和列中各元素的结构以点的形式在较低维的空间中表示出来,将列联表变为一张散点图,将列联表中的各个分类变量水平的因子载荷显示在散点图中。
三、对应分析的步骤
1)计算规格化的频率矩阵。
2)求行剖面协方差矩阵。
3)求列剖面协方差矩阵。
4)建立R→Q型因子分析的对应关系。
具体到列联表中,就是从由行剖面协方差阵体现出来的列变量,到由列剖面协方差阵体现出来的行变量之间的对应关系。
矩阵B和A有相同的非零特征根,但A和B具有不同的特征向量,从而有不同的因子“得分”。
5)确定因子个数和相应得分。
一般将维度确定为2,维度得分即变量降维后在二维散点图中的“坐标”。距离相近的表示它们有差不多一样大的“得分”,则认为它们“相互对应”,体现了对应分析的基本思想。
第二节 对应分析的技术实现
一、定义变量范围
Analyze→Dimension Reduction→ Correspondence Analysis
Row
Column
二、定义模型参数 Model
(1)Dimensions in solution
(2)Distance Measure
① Chi square选项,即卡方
② Euclidean选项,即欧氏距离
(3)Standization Method。确定标准化方法
(4)Normalization Method。选择正规化方法
三、输出对应分析统计表 Statistics
(1)Correspondence table。输出含有行边际和列边际总和的交叉频数分布列联表。
(2)Overview of row points。输出行综合表
(3)Overview of column points。输出列综合表
(4)Permutations of the correspondence table。输出在第一维度上得分的递增顺序排列的对应交叉列联表。
(5)Row profiles。即行剖面条件频率分布表
(6)Column profiles。即列剖面条件频率分布表
(7)Confidence Stat
您可能关注的文档
- 市场调查与预测第一章.ppt
- 市场调查与预测实训.pptx
- 市场调查与预测项目八.ppt
- 市场调查与预测项目九.ppt
- 市场调查与预测项目六.ppt
- 市场调查与预测项目七.ppt
- 市场调查与预测项目七.pptx
- 市场调查与预测项目十.ppt
- 市场调查与预测项目十二.ppt
- 市场调查与预测项目十三.ppt
- 2025年中国锻铁围栏市场调查研究报告.docx
- 2025年中国椭圆型市场调查研究报告.docx
- 2025年中国无蔗糖原味豆浆市场调查研究报告.docx
- 2025-2031年中国泛在电力物联网行业发展运行现状及投资潜力预测报告.docx
- 2025年中国制袋机零件市场调查研究报告.docx
- 2025年中国智能除垢型电子水处理仪市场调查研究报告.docx
- 2025-2031年中国甘肃省乡村旅游行业市场深度研究及投资策略研究报告.docx
- 2025-2031年中国干海产品行业市场发展监测及投资战略规划报告.docx
- 2025年中国全铝图解易拉盖市场调查研究报告.docx
- 2025年中国人造毛皮服装市场调查研究报告.docx
文档评论(0)