联列表和相合性分.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
联列表和相合性分析 概述 联列表和相合性分析用于发现和研究名义测度变量间的相互关系 能够回答如下问题: (1)能否辨认出变量间的相互关系,关系是否显著? (2)是否存在其他变量,通过观察它们能证明,或进一步说明,或修正之前的研究成果? (3)能否说明关系的程度和方向? 使用联列表能以表格方式说明调查结果,并从中辨认出变量间可能的相互关系 变量及其状态的选择要有事实依据,否则存在随意建立关系或掩盖实际关系的危险 若发现相互关系,则可用相合性分析研究相关性是偶然出现,还是存在系统性关系 联列表和相合性分析是一种用于研究两个不同事实的分析法,根据研究的问题和抽样的方法,可进行同一性检验或变量间的相关性分析 同一性检验是研究某特征在两个或多个样本中是否同分布 相合性分析是研究观测变量在统计上是相互独立还是相互关联 分析过程 进行联列表和相合性分析有如下三个步骤: (1)编制联列表 (2)解释结果 (3)检验相关关系 (1)编制联列表 以两个具有多个水平的名义测度变量来说明 例子:一家贸易连锁店为了制定物流计划,希望知道用黄油或人造黄油作为面包片涂层的偏好是否与居住地有关。为了回答该问题,随机选择了181个人,询问他们的居住地和偏爱的面包涂层。调查结果如下表: (2)解释结果 为更好地理解上述例子,把绝对数转换为百分率 常有三种不同的表,可根据具体问题进行选择 行百分率(横向百分率)、列百分率(纵向百分率)、总百分率 仅分布不同还不足够推断出存在相互关系。可能在加入第三个变量后,就需要修正已经做出的判断 对猜测的关系,加入第三个变量后,既可能证实关系的最初形式,也可能辨认出关系的其他形式,还可能揭示出它仅为虚假的关系; (3)检验相关关系 在借助联列表估计出相关关系后,可用统计方法检验此事实是偶然出现在样本中,还是可以推广到总体中 a.统计独立性检验 实测数据须与期望值数据相比较 期望值=行和×列和/总和 检验统计量: 假设:H0:X和Y相互独立 H0:变量X的每个特征水平的比例在两个样本中相等 e11=39.8,e12=28.2,e21=66.2,e22=46.8 给定5%的显著性水平,自由度为1,查得理论值为3.84 故拒绝零假设,对黄油/人造黄油的偏好与居住地有关 严格来说,在H0下的卡方统计量仅近似服从卡方分布。当样本容量小时,近似度并不令人满意,为此采用Yates修正统计量: 通常用于样本容量20-60的情况 b.相关性程度检验 由卡方检验得出变量相关后,希望获得如相关程度或方向等进一步信息 系数: 该值越大,相关性越强。通常大于0.3则认为比普通关系重要 不同实验的该系数不能相互比较 若联列表中的变量有两个以上的水平,则该判别值可能大于1,此时使用相合系数: CC能够计算上限值,但也不能相互比较 Cramer’s V 基于卡方统计量的为第一类指标,除此之外还有说明两变量相关程度的系数,这类系数衡量一个变量状态的信息对预测另一变量的贡献程度的λ指标 当受访者面包涂层偏好未知时,会倾向于将他归入城市居民,这时会预测错37.6%的受访者;若已知某受访者的面包涂层偏好,则总共可能预测错的受访者为12.7%+16.6%=29.3% 则由于第二个变量(面包涂层偏好)信息而减少的错误预测与信息未知时的错误预测概率之比为: λ居住地=0.083/0.376=0.221 λ1=((45+83)-113)/(181-113)=0.221 λ的取值范围在0-1之间,接近0表示第二个变量的信息对预测第一个变量没有贡献(不能用来预测第一个变量),而值接近1表示信息可实现无误预测 注意: 所有基于相合性分析得出的相互关系只是统计关系。若由此确定存在如因果等关系可能会导致重大错误和错误的结论 使用卡方分布的前提:单个观察要独立;每个观察只能属于一个特征水平的组合;期望频率小于5的单元格比例不能超过20%等 * * 其它死因 吸烟者 不吸烟者 55 60 总和 115 总和 67 68 135 肺癌 12 8 20 某医院病人死亡原因的统计数据 肺癌 其它死因 吸烟者 不吸烟者 20 10 80 90 100 100 30 170 200 肺癌 其它死因 吸烟者 不吸烟者 18 12 63 107 81 119 30 170 200 同一性和相合性分析都采用卡方检验,但解释结果和推出一般性结论上有根本性差别 问题 变量1 变量2 大学生辍学和兼职间是否存在关系 辍学:未毕业就离校 兼职:每周少于15小时;每周15-30;每周多于30 自杀和抑郁间的关系 自杀:是、否 抑郁:弱、中、强 进行过市场测试的产品是否比未进行过的更容易成功 成功引入市场:引入市场6个月内,产品撤出 是否进行市

文档评论(0)

155****8706 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档