网站大量收购独家精品文档,联系QQ:2885784924

第9章事物间的相关关系相关分析PPT.pptx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章事物间的相关关系相关分析PPT

第9章事物间的相关关系——相关分析内容提要9.1相关分析概述相关分析概述寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即:有关与无关。在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。对相关关系的测量:散点图相关系数(一)散点图散点图是考察两个变量之间相关关系的最直观的图形,以点的分布反映两变量之间的关系。Graphs——Legacy Dialogs——Scatter/Dot(一)散点图例:数据“收视率前15.sav”包含了2010年国内电视频道全天收视率及收视份额前15名的数据。试作散点图考察电视频道收视率与收视份额的关系。选入标志观测量的变量勾选显示观测量的标志(一)散点图添加回归趋势线(二)相关系数虽然散点图能够直观地展现变量之间的统计关系,但并不精确。相关系数以数值的方式精确地反映了两个变量间线性相关的强弱程度。对不同类型的变量应采用不同的相关系数指标,但其取值范围和含义都是相同的: 相关系数 r 的取值在[-1,1]之间;r >0表示两变量存在正的线性相关关系;r <0表示两变量存在负的线性相关关系; r =0表示两变量无线性相关关系;r =1表示两变量完全正相关;r =-1表示两变量完全负相关; | r | >0.8表示两变量之间具有较强的线性关系;| r |<0.3表示两变量之间的线性相关关系较弱。9.2定类变量的相关定类变量的相关——列联相关当卡方检验的结果是显著的,则可知两个变量之间是不独立的,即一个变量对另一个变量有影响。这种影响程度有多强呢?这就要计算其中的关联强度。关联强度是指两个不独立的变量之间的关系有多紧密。卡方检验从定性的角度分析是否存在相关,各种关联指标从定量的角度分析相关的程度如何。定类变量的相关用于测量定类变量关联强度的测量指标变量间是否具有对称关系:对于两个变量X和Y,如果我们认为X会影响Y,而Y不会影响X,就称X和Y具有不对称关系;反之,如果我们不确定或不区分X影响Y,还是Y影响X,就称X和Y是对称关系。相关系数是否具有消减误差比例的意义:如果Y与X有关系,那么利用X的信息来预测Y时,就会比不知道X的值来预测Y避免一定的盲目性,从而减少若干误差。X和Y的关系越密切,减少的误差会越多。预测时能够减少多少误差,可以反映X和Y之间关系的强弱。定类变量关联强度的测量指标适用于对称关系的相关系数:Phi系数:最简单的基于卡方的测量指标。对于大于2×2的列联表,其值可能大于1,故该系数主要用于2×2的列联表。C系数(Contingency Coefficient):对Phi系数进行了一定的修正,其值介于0~1之间。但随着列联表行列的增加,C系数会不断地接近1,但不可能等于1。故即使两个变量间有最强的关联强度,从C系数中也得不到反映,所以C系数对格数太少的列来说并不是好的测量指标,它会低估关联强度。 CV系数(Cramer’s V):也是对Phi系数的一种修正,同时相对于C系数,解决了对列联表单元格数目限制的问题,其值介于0~1之间,也可以等于0或1。定类变量关联强度的测量指标适用于消减误差比例的相关系数(非对称关系):Lambda系数:取值在0~1之间,这个值越大,说明自变量对预测的因变量的帮助越大。如果它为1,说明自变量有良好的预测因变量的能力;如果它为0,说明自变量信息对预测因变量没有任何用处。Tau-y系数:针对两个变量具有不对称关系给出的相关系数,具有消减误差比例的意义。Tau-y系数比Lambda系数更敏感。不确定系数(Uncertainty Coefficient):取值在0~1之间。值越大,说明自变量对预测的因变量帮助越大。如果它为1,说明自变量可向因变量提供最多的信息;如果它为0,说明自变量对预测因变量没有用。定类变量关联强度的测量指标例:根据数据“住房状况调查.sav”,分析户口状况与房屋产权之间是否存在显著的相关关系?关联程度有多强?判断定类变量之间的关联性(独立性)先进行卡方检验。当样本量n≥40,且只有20%以下的单元格的期望频数1≤ fe <5时,用对数似然比计算的卡方。定类变量关联强度的测量指标本例中两变量属于非对称关系,因此选择适用于消减误差比例的相关系数。定类变量关联强度的测量指标在5%的显著性水平下,两变量的相关关系显著。tau-y相关系数说明:户口状况作为因变量时,即用房屋产权去预测户口状况可消减8.5%的误差;而用户口状况去预测房屋产权可消减3.4%的误差。9.3定序变量的相关定序变量关联强度的测量指标对于定序变量,排列顺序也可传达有用的信息。对定序变量之间关联强度的测量叫“等级相关”Nc——同序对:定序变量x和定序变量

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档