第十章 资料的统计分析2--双变量分析1.pptVIP

第十章 资料的统计分析2--双变量分析1.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章 资料的统计分析(2) ——双变量分析 本章主要内容: 1、变量间的关系 2、交互分类 3、其他层次变量的相关测量与检验 4、回归分析 第一节 变量间的关系 一、相关关系 1、概念:两个变量之间的相关(correlation)关系指的是当其中一个变量发生变化时(或取值不同时),另一个变量也随之发生变化(取值也不同)。反过来也一样。 2、相关关系的方向。对于定序以上层次的变量来说,变量与变量之间的关系可以分为正关系与负关系两个方向。 第一节 变量间的关系 所谓两个变量具有正相关关系,指的是一个变量的取值增加时,另一个变量的取值也随之增加,反之亦然。或者说,两个变量的取值变化具有同方向性。 所谓两个变量具有负相关关系,指的是一个变量的取值增加时,另一个变量的取值随之减少,反之亦然。或者说,两个变量的取值变化具有反方向性。 第一节 变量间的关系 3、相关关系的强度 指的是他们之间相关关系程度的强弱和大小。 变量间相关程度的统计表示是相关系数。一般相关系数的取值都在-1到+1之间,这里的正负号表示的是相关关系的方向,实际的数值的绝对值表示的是相关关系的强弱。 第一节 变量间的关系 4、相关关系的类型 可分为直线相关和曲线相关。 所谓直线相关,指的是当变量X值发生变动时,变量Y的值也随之发生大致均等的变动。 5、相关关系与散点图:散点图用于定距以上层次的变量。 第一节 变量间的关系 二、因果关系 1、概念:指的是当其中一个变量变化时会引起或导致另一个变量也随之发生变化,但反过来,当后一变量变化时,却不会引起前一变量的变化。 2、因果关系的三个条件: A、首先,变量X与变量Y之间存在不对称的相关关系。 B、变量X与变量Y在发生的顺序上有先后之别。 C、变量X与变量Y的关系不是同源于第三个变量的影响。 第二节 交互分类 第二节 交互分类 探讨两个定类变量(或一个定类,一个定序变量)之间关系的方法。 一、交互分类的意义与作用 所谓交互分类(cross classification),就是将调查所得的一组数据按照两个不同的变量进行综合的分类。 交互分类可以较为深入的描述样本资料的分布状况和内在结构。更重要的是,交互分类可以对变量之间的关系进行分析和解释。 交互分类所适用的变量层次是定类变量和定序变量。 第二节 交互分类 二、交互分类表的形式和要求 1、每个表的顶端要有表号和标题。表号的作用是明确指示,方便阅读或讨论;而表的标题则概括表中数据的内容和意义。 2、表格中的线条一定要规范、简洁,最好不用竖线。 3、表中百分比符号的简便处理方式。 4、在表的下端用括号标出每一纵栏所对应的频数,以指示每一栏百分比所具有的基础(即个案的多少)。 第二节 交互分类 5、表内的百分比通常保留一位小数。 6、对于交互分类的两个变量的安排,通常是将自变量、或被看作是自变量的或用来作解释的那个变量放在上层;而将因变量或被看作因变量放在表的左侧。 7、交互分类的两个变量的变量值应有所限制,特别是不能同时具有多个变量值。 第二节 交互分类 三、x2检验 公式为: fo为交互分类表中每一格的观察频数,fe为交互分类表中fo所对应的期望频数。 第二节 交互分类 四、关系强度的测量 显著性水平的高低不能判断或估计变量间关系的强弱,而只是代表确定变量间存在关系的可信程度。 1、Φ系数。当交互分类表为2×2表时候,可用它测量变量关系的强度。 第二节 交互分类 四、关系强度的测量 显著性水平的高低不能判断或估计变量间关系的强弱,而只是代表确定变量间存在关系的可信程度。 1、Φ系数。 2、v系数。 3、c系数。(不受样本规模大小的影响)。 第二节 交互分类 4、λ系数 优点是具有消减误差比例(proportionate reduction in error,PRE)的意义。PRE指的是知道X的值去预测与它相关的变量Y值时所减少的误差(E1-E2)与总误差的比。即PRE= (E1-E2)/E1 PRE越大,表示以X值去预测Y值时能够减少的误差所占的比例越大,换句话说,X与Y之间就越是相关,或者说,X与Y关系越强。 λ系数的基本特点就是以众值作为预测的准则。公式为 λ=(∑fy-Fy)÷(n-Fy) fy表示变量X的每一个值之下的变量Y的众值;Fy表示变量Y的边际分布中的众值。 Tau-y(简记为τy) 第三节 其他层次变量的相关测量与检验 1、定序变量与定序变量 如果两个变量都是定序变量,可以用古德曼和古鲁斯卡的Gamma系数来测量它们之间的相关关系。常用G(或Υ)表示,其取值范围是[-1,+1],适用于分析对称关系,且既表示相关的方向性,也表示相关的程度。它也具有消减误差比例的意义。 公式为: 第三节 其他层次变量的相关测量与检验

文档评论(0)

我思故我在 + 关注
实名认证
文档贡献者

部分用户下载打不开,可能是因为word版本过低,用wps打开,然后另存为一个新的,就可以用word打开了

1亿VIP精品文档

相关文档