第十二讲__列联表(二).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二讲 列联表(二) -列联强度 χ2检验 变量之间的关系 定类变量—定类变量 定序变量—定序变量 定距变量—定距变量 定类变量—定序变量 测量法是什么? 定类变量—定距变量 定序变量—定距变量 知识点: 一、 2×2表——f系数和Q系数 二、 r×c表——以χ2为基础的关系强度系数 Phi系数 列联系数C V系数 三、r×c表——以PRE为基础的关系强度系数 λ系数 τ系数 一、 2×2表——f系数和Q系数 1.“ad-bc”的意义; 2. f系数 3. Q系数 1.1 “ad-bc”的含义 当变量间无相关的时候,存在变量的条件分布和边缘分布相同。 根据变量独立的要求有 a b a + c b + d ad = bc 1.2 f系数 1.3 Q系数 二、r ×c表——以χ2为基础的相关性测量 复习一下χ2公式: 2.1 f系数 公式: 不足之处: F值没有上限,这样系数间就缺乏了比较 2.2 列联系数C 公式 2.3克拉默V系数 公式: 例题 参看教材P297 例题3 三、PRE相关系数 1.什么是PRE(消减误差比例)? 2. λ 系数 3. τ系数 3.1.1 PRE相关系数的含义 PRE(Proportionate reduction in error)消减误差比例: 我们在预测或解释社会现象y时,难免会有误差(错误),假定另一种社会现象x与y是有关系的,我们可以根据x的值来预测y的值,理应可以减少若干误差,PRE系数值表示的就是x对y的误差的消减程度。 3.1.2 理解PRE 如假定不知道x的值,我们在认识y时的全部误差是E1。我们知道x的值,可以根据x的值来认识y的值时的误差的总数(不可认知的部分)为E2,那么用x的值来预测y的值时减少的误差就是E1-E2,这个值( E1-E2 )与y全部误差的比例,则称谓消减了的误差比例. 3.1.3 PRE的基本公式 E1:不知道x与y有关系时,预测y所产生的全部误差; E2:知道x与y有关系时,x预测y所产生的误差 3.1.4 PRE值的取值范围 1、PRE的取值范围是[0,1]; 2、E2=0,则PRE=1,x与y是全相关,用x解释y时不会产生误差 3、E1=E2,则PRE=0,x与y是无相关,用x来预测y时产生的误差等于不用x来预测y时的误差 3.1.5 PRE值的意义 两个变量之间关系的大小 用一个变量预测另一个变量能消减的误差比例 4、两个定类变量: λ系数, τ系数 (1) λ系数 基本逻辑:用一个定类变量的值来预测另一个定类变量的值时,如果以众数作为测量的准则,可以减少多少误差。 消减的误差在全部误差中所占的比例越大,就表示两个变量的相关越强 λ 系数以众数为预测准则; λ 系数以众数为预测准则 假定x是自变量,y是因变量,公式中的分母表示在不知道x值的情况下来预测y值时所产生的全部误差,即E1=n-My 公式中的分子,表示根据x值来预测y的众值时所能减少的误差,其计算的方法是:E1-E2=(n-My)-(n-∑my)= ∑my-My 公式: (1)、不对称形式: My=Y变项的众数次数 my=X变项的每个值(类别)之下Y变项的众数的次数 n=全部个案数 n-My=不知道x值的情况下预测Y值产生的误差 分子E1-E2=(n-My)-(n-∑my)= ∑my-My 例1:分析性别与理想志愿之间的关系 (2)对称形式:不确定两个变量的影响方向 My=Y变项的众数次数 Mx=X变项的众数次数 mx=Y变项的每个值(类别)之下X变项的众数次数 my=X变项的每个值(类别)之下Y变项的众数次数 n=全部个案数 例:青年的教育期望与父母的教育期望 例题四:参见教材P302 特例:如下表,72.4%的制造业工人和64.3%的服务业人员注重物质报酬,职业类型与价值取向是略有影响的,但是 2、τ系数(参见教材P304-307) 不对称测量法 系数值介于0-1之间 计算系数时包括了所有的边缘次数和条件次数 如果是不对称关系最好选用tau-y计算 计算过程:先求出E1和E2,计算消减误差的比例 n=全部个案数目 f=某条件次数 Fy=Y变项的某个边缘次数 Fx=X变项的某个边缘次数 E1:如果不知道x,则每次预测y变量时的错误机率是(n-Fy)/n,乘以Fy表示y值时的错误总数,y变量有多个值,将各值的错误总数相加起来就是E1; E2:如果知道x变量(如某一性别),则预测y值时的

文档评论(0)

wxc6688 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档