第十二讲__列联表(二).pptVIP

下载本文档

120
0
约2.27千字
约 35页
2018-05-13 发布于四川
举报
版权申诉

第十二讲__列联表(二).ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第十二讲列联表（二）－列联强度 χ2检验变量之间的关系定类变量—定类变量定序变量—定序变量定距变量—定距变量定类变量—定序变量测量法是什么？定类变量—定距变量定序变量—定距变量知识点：一、 2×2表——f系数和Q系数二、 r×c表——以χ2为基础的关系强度系数 Phi系数列联系数C V系数三、r×c表——以PRE为基础的关系强度系数 λ系数 τ系数一、 2×2表——f系数和Q系数 1.“ad-bc”的意义； 2. f系数 3. Q系数 1.1 “ad-bc”的含义当变量间无相关的时候，存在变量的条件分布和边缘分布相同。根据变量独立的要求有 a b a + c b + d ad = bc 1.2 f系数 1.3 Q系数二、r ×c表——以χ2为基础的相关性测量复习一下χ2公式： 2.1 f系数公式：不足之处： F值没有上限，这样系数间就缺乏了比较 2.2 列联系数C 公式 2.3克拉默V系数公式：例题参看教材P297 例题3 三、PRE相关系数 1.什么是PRE（消减误差比例）？ 2. λ 系数 3. τ系数 3.1.1 PRE相关系数的含义 PRE（Proportionate reduction in error）消减误差比例：我们在预测或解释社会现象y时，难免会有误差（错误），假定另一种社会现象x与y是有关系的，我们可以根据x的值来预测y的值，理应可以减少若干误差，PRE系数值表示的就是x对y的误差的消减程度。 3.1.2 理解PRE 如假定不知道x的值，我们在认识y时的全部误差是E1。我们知道x的值，可以根据x的值来认识y的值时的误差的总数(不可认知的部分）为E2，那么用x的值来预测y的值时减少的误差就是E1-E2，这个值（ E1-E2 ）与y全部误差的比例，则称谓消减了的误差比例. 3.1.3 PRE的基本公式 E1：不知道x与y有关系时，预测y所产生的全部误差； E2：知道x与y有关系时，x预测y所产生的误差 3.1.4 PRE值的取值范围 1、PRE的取值范围是[0，1]； 2、E2=0，则PRE=1，x与y是全相关，用x解释y时不会产生误差 3、E1=E2，则PRE=0，x与y是无相关，用x来预测y时产生的误差等于不用x来预测y时的误差 3.1.5 PRE值的意义两个变量之间关系的大小用一个变量预测另一个变量能消减的误差比例 4、两个定类变量： λ系数， τ系数 (1) λ系数基本逻辑：用一个定类变量的值来预测另一个定类变量的值时，如果以众数作为测量的准则，可以减少多少误差。消减的误差在全部误差中所占的比例越大，就表示两个变量的相关越强 λ 系数以众数为预测准则； λ 系数以众数为预测准则假定x是自变量，y是因变量，公式中的分母表示在不知道x值的情况下来预测y值时所产生的全部误差，即E1=n-My 公式中的分子，表示根据x值来预测y的众值时所能减少的误差，其计算的方法是：E1-E2=(n-My)-(n-∑my)= ∑my-My 公式：（1）、不对称形式： My=Y变项的众数次数 my=X变项的每个值（类别）之下Y变项的众数的次数 n=全部个案数 n-My=不知道x值的情况下预测Y值产生的误差分子E1-E2=（n-My）-（n-∑my）= ∑my-My 例1：分析性别与理想志愿之间的关系（2）对称形式：不确定两个变量的影响方向 My=Y变项的众数次数 Mx=X变项的众数次数 mx=Y变项的每个值（类别）之下X变项的众数次数 my=X变项的每个值（类别）之下Y变项的众数次数 n=全部个案数例：青年的教育期望与父母的教育期望例题四：参见教材Ｐ302 特例：如下表，72.4%的制造业工人和64.3%的服务业人员注重物质报酬，职业类型与价值取向是略有影响的，但是 2、τ系数（参见教材P304-307）不对称测量法系数值介于0-1之间计算系数时包括了所有的边缘次数和条件次数如果是不对称关系最好选用tau-y计算计算过程：先求出E1和E2，计算消减误差的比例 n=全部个案数目 f=某条件次数 Fy=Y变项的某个边缘次数 Fx=X变项的某个边缘次数 E1：如果不知道x，则每次预测y变量时的错误机率是（n-Fy）/n，乘以Fy表示y值时的错误总数，y变量有多个值，将各值的错误总数相加起来就是E1； E2：如果知道x变量（如某一性别），则预测y值时的