- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
联列表与相合性分析
联列表和相合性分析;概述;;;联列表和相合性分析是一种用于研究两个不同事实的分析法,根据研究的问题和抽样的方法,可进行同一性检验或变量间的相关性分析
同一性检验是研究某特征在两个或多个样本中是否同分布
;相合性分析是研究观测变量在统计上是相互独立还是相互关联
;;分析过程;(1)编制联列表
以两个具有多个水平的名义测度变量来说明;例子:一家贸易连锁店为了制定物流计划,希望知道用黄油或人造黄油作为面包片涂层的偏好是否与居住地有关。为了回答该问题,随机选择了181个人,询问他们的居住地和偏爱的面包涂层。调查结果如下表:;(2)解释结果
为更好地理解上述例子,把绝对数转换为百分率
常有三种不同的表,可根据具体问题进行选择
行百分率(横向百分率)、列百分率(纵向百分率)、总百分率;;;;;期望值=行和×列和/总和
检验统计量:
假设:H0:X和Y相互独立
H0:变量X的每个特征水平的比例在两个样本中相等;e11=39.8,e12=28.2,e21=66.2,e22=46.8
给定5%的显著性水平,自由度为1,查得理论值为3.84
故拒绝零假设,对黄油/人造黄油的偏好与居住地有关;严格来说,在H0下的卡方统计量仅近似服从卡方分布。当样本容量小时,近似度并不令人满意,为此采用Yates修正统计量:
通常用于样本容量20-60的情况;b.相关性程度检验
由卡方检验得出变量相关后,希望获得如相关程度或方向等进一步信息
系数:
该值越大,相关性越强。通常大于0.3则认为比普通关系重要
不同实验的该系数不能相互比较
;若联列表中的变量有两个以上的水平,则该判别值可能大于1,此时使用相合系数:;CC能够计算上限值,但也不能相互比较
Cramer’s V
;基于卡方统计量的为第一类指标,除此之外还有说明两变量相关程度的系数,这类系数衡量一个变量状态的信息对预测另一变量的贡献程度的λ指标
当受访者面包涂层偏好未知时,会倾向于将他归入城市居民,这时会预测错37.6%的受访者;若已知某受访者的面包涂层偏好,则总共可能预测错的受访者为12.7%+16.6%=29.3%;则由于第二个变量(面包涂层偏好)信息而减少的错误预测与信息未知时的错误???测概率之比为:
λ居住地=0.083/0.376=0.221
λ1=((45+83)-113)/(181-113)=0.221
λ的取值范围在0-1之间,接近0表示第二个变量的信息对预测第一个变量没有贡献(不能用来预测第一个变量),而值接近1表示信息可实现无误预测;注意:
所有基于相合性分析得出的相互关系只是统计关系。若由此确定存在如因果等关系可能会导致重大错误和错误的结论
使用卡方分布的前提:单个观察要独立;每个观察只能属于一个特征水平的组合;期望频率小于5的单元格比例不能超过20%等;
文档评论(0)