第九章 对应分析1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章 对应分析1

一、列联表分析 列联表contingency table 用来描述定类尺度和定序尺度数据的各种状态或是相关关系 两变量列联表的一般形式 频率表: 两变量间相关关系的检验 例:手机消费者产品偏好研究 列联表分析例:收入水平与PDA Cell: 单元格输出内容 Statistics: 列联表分析例:收入水平与PDA 频率表: row 频率表:total 检验:不同收入水平拥有PDA数量上的差异是否来自于纯随机性? 控制第三变量:受教育水平 受教育水平与PDA:控制收入水平 二、对应分析的基本思路:对行元素与列元素提取主成分 Row Profile Matrix Column Profile Matrix Principal Coordinates Can we put them on the same axes? Principal Correspondence Analysis 一个实例:郑州潜在手机顾客偏好调查 手机潜在用户:7个特征属性 4个年龄特征“18-25岁”、“26-35岁”、“36-45岁”、“46-55岁” 3个文化程度特征“初中以下”、“高中/中专”和“大学及以上”。 手机: 7个特征属性 “待机时间长”、“大显示屏”、“操作简单”、“外观时尚”、“功能强”、“价格合理”和“信号接收好”。 研究人员希望通过对应分析发现不同特征属性的手机潜在顾客对手机属性特征的偏好。 表一 潜在用户调研基础数据:行元素、列元素均为七维空间中的点 计算惯量,确定维度:行、列均简化到二维空间 (1)各类别在行维度上的得分(投影) (2)各类别在列维度上的得分(投影) 对应分析图(定位图):行、列主成分得分放在一张图中 三、对应分析的理论推导 数据规格化: 行截面:Rp中的n个点 列截面:Rn中的p个点 数据规格化-续 行截面:概率加权坐标向量 样品间欧式距离 加权欧式距离 行截面提取主成分 变换后的行截面矩阵为 Pr的协方差阵为: 列截面提取主成分:与行截面类似有 四、对应分析的SPSS实现 定义变量取值范围 模型: 输出统计量 输出图形 例:收入水平与学历 analyze→data reduction→correspondence analysis 提取因子数 主要分析行列变量的联系 列联表 行变量之因子载荷、方差贡献等 频数的行百分比 行列变量对应图 行变量载荷图 行变量各分类因子载荷图 总惯量 非零特征根 累积方差贡献 ?2统计量及其p值 ?2 =n..×总惯量 显著:列联表行列之间有较强的相关性 * Ma Xin, North China Electric Power University * Ma Xin, North China Electric Power University 内容提要 从上表可以得到的信息:不同年龄顾客对公司产品的偏好、所有顾客整体评价、顾客结构、年龄结构与偏好的相关关系 频数 边缘概率 边缘概率 联合概率:特性A第i种状态与特性B第j种状态出现的概率 如果变量A和B是独立的,则应有 检验假设: 如果拒绝原假设,我们希望进一步了解两变量各种状态之间的关系→对应分析 analyze→descriptive statistics → crosstab… 显示频数分布柱形图 控制变量/分层变量 显示观测频数 显示频率 显示行百分比 显示列百分比 显示总百分比 ?2检验 随着收入的水平的提高,拥有PDA的人数增多 检验结果:拒绝原假设,两变量间有显著相关性 通常受教育水平越高,工资越高 收入与PDA的相关性实质上主要来自于受教育水平与PDA的相关性 各维度的惯量、奇异值 六个非零特征根 累积方差贡献 计算行、列在各维度的得分(投影) 各水平样本数占总数比例 两主成分的变量共同度 计算行、列在各维度的得分(投影) 外观时尚 功能强 大显示屏 价格合理 接收信号好 待机时间长 操作简单 18-25岁 初中以下 46-55岁 高中/中专 大学及以上 26-35岁 36-45岁 (1)“初中及以下”学历:“操作简单”。 (2)年龄“18-25” 青年: “外观时尚” (3)年龄“46-55”之间、“高中/中专”学历:“大屏显示”。 (4)年龄“26-45”之间: “待机时间长”和“信号接收好”。 不同指标间数量级差异会开来困扰 间的欧式距离 可以看成点 : 根据矩阵知识可知,∑r=ZZ’和∑c=Z’Z有完全相同的非零特征根,设为?1≥ ?2≥… ≥ ?p 设?1…?r为对应?1… ?r的∑r的特征向量,则有: 两边左乘Z’: (Z’?j)即为对应?j的∑c的特征向量 这建立了R型因子分析与Q型因子分析的关系,且因∑r和∑c有相同非零特征根,因此提取公因子数和累积方差贡献都相同 * Ma Xi

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档