- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3. 出现异常值时慎用相关。 4. 相关未必真有内在联系 5. 分层资料盲目合并易出假象。 第二节 秩相关 一、秩相关的概念及其统计描述 Pearson积矩相关的假设检验要求x和y均服从正态分 布。对不服从正态分布的资料,或是总体分布未知的资料或者原始数据用等级表示的资料,需采用秩相关来描述两变量的相关性。 秩相关是利用两变量的秩次大小作直线相关分析,对 原变量的分布不作要求,属非参数统计方法。 其中最常用的统计量是Spearman秩相关系数rs,又称等级相关系数。 例4 某研究者对15例30~50岁成年男子的舒张压(mmHg)与夜间最低血氧含量分级进行研究,结果见表2,试分析两者的关联性。 表2 15例成年男子的舒张压与夜间最低血氧含量分级值 将两变量x、y成对的观察值分别从小到大排序编秩, 以pi表示xi的秩次;qi表示yi的秩次,观察值相同的取平均秩次。 将pi、qi直接替换xi与yi,对秩次计算得的相关系数 称为Spearman秩相关系数,用统计量rs表示。 秩相关为正,表明两变量间有正相关关系。 二、秩相关系数的统计推断 类似于积矩相关系数,秩相关系数的检验假设为: H0:ρs=0 H1:ρs≠0 当 n≤50时,查附表14 rs界值表; n>50时,可采用t检验。 例5 对例4的秩相关系数作假设检验。 (1) 建立假设 H0: ρs=0,即舒张压与夜间最低血氧含量分级有无关关系 H1: ρs≠0,即舒张压与夜间最低血氧含量分级有相关关系 (2) 确定检验水准 α=0.05 (3) 计算统计rs值 (4) 确定P值 本例n=1550,查等级相关系数戒指表, 得P0.001. (5) 下结论 因为P0.001,按α=0.05的水准,拒绝H0,接受H1, 差异有统计学意义。可以认为舒张压与夜间最低血 氧含量分级之间存在相关关系,且为正相关。 第三节 分类变量的关联性分析 对定性变量之间的联系通常用的方法是根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联分析,即关于两种属性独立性的卡方检验。 一、交叉分类 2×2 表的关联分析 例6 为研究青少年在校情况与对艾滋病知晓情况之间的关系,某研究者在某地共调查了384名青少年,并对每名青少年按是否在校和对艾滋病是否知晓两种属性交叉分类,如表3所示。试问青少年在校情况与对艾滋病知晓情况之间是否存在关联性? 表3 某地青少年是否在校与对艾滋病是否知晓交叉表 该例是关于样本含量为384的一份随机样本的受试对象两种属性(变量)的关联性的研究。 和分析两定量变量间的相关性类似,表3是关于两个 变量的一份随机样本,要检验的是是否在校与对艾滋病是否知晓两个变量之间的关联性。 交叉分类资料独立性检验与比较两独立样本频率的假 设检验所用的卡方公式、理论频数计算公式和自由度 的计算公式完全相同。但是,必须注意,这两类问题 的研究目的、设计方案、数据结构以及对结果的解释 都是不同的。 现对例6的数据作两属性的关联性分析 (1) 建立假设 H0:青少年是否在校与对艾滋病是否知晓之间互相独立 H1:青少年是否在校与对艾滋病是否知晓之间互相关联 (2) 确定检验水准 α=0.05 (3) 计算统计量 值 (4) 确定P值 υ=(2-1)?(2-1)=1,查卡方界值表,得P0.01. (5) 下结论 因为P0.01,按α=0.05的水准,拒绝H0,接受 H1,差异有统计学意义。说明青少年是否在校 与对艾滋病是否知晓之间互相关联存在关联性。 关于两个分类变量之间的关联程度,可采用 系数、Cramer V系数和Pearson列联系数来度量。 这三个系数值越接近于0,说明两个分类变量之间几乎没有关系,越接近于1,说明关系越密切。 系数只适用于四格表,对于多行多列资料,只能用Cramer V系数与列联系数。列联系数的最大值为 ,如四格表资料的列联系数最大值为
文档评论(0)