统计学课件-相关分析.pptVIP

统计学课件-相关分析.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关分析-2 一、质与量的相关 一个变量为性质变量,另一个变量为数量变量,这样的两个变量之间的相关称为质与量的相关。 1、点二列相关 适用条件 一个变量为正态、连续变量,另一个变量为真正的二分名义变量,这两个变量之间的相关,称为点二列相关(point-biserial correlation)。 有时一个变量并非真正的二分变量,而是双峰分布的变量,也可以用点二列相关来表示。 点二列相关系数的计算公式为 或 ( 19.1 ) ( 19.2 ) 公式中: 是与二分名义变量的一个值对应的连续变量的平均数 是与二分名义变量的另一个值对应的连续变量的平均数 p 和q分别是二分名义变量的两个值各自所占的比例,p+q=1 St 是连续变量的标准差 表19-1 五岁幼儿投掷砂袋成绩 例19-1:18个五岁幼儿掷砂袋(150克),成绩如表19-1,问性别与投掷成绩的相关情况如何? 序号 成绩 性别 序号 成绩 性别 1 4.0 1 10 3.4 2 2 3.6 2 11 4.9 1 3 3.5 2 12 3.7 2 4 3.2 2 13 3.3 2 5 4.4 1 14 4.7 1 6 4.8 1 15 4.8 1 7 3.8 2 16 3.1 2 8 5.2 1 17 2.9 2 9 4.7 1 18 3.4 2 表19-2 五岁幼儿性别与投掷砂袋点二列相关计算表 序号 成绩 性 别 序号 成绩 性 别 1 4.0 1 13 3.3 2 2 3.6 2 14 4.7 1 3 3.5 2 15 4.8 1 4 3.2 2 16 3.1 2 5 4.4 1 17 2.9 2 6 4.8 1 18 3.4 2 7 3.8 2 分数总和 71.4 37.5 33.9 8 5.2 1 人数总和 18 8 10 9 4.7 1 人数比率 0.444 0.556 10 3.4 2 平均数 3.967 4.688 3.390 11 4.9 1 标准差 0.709 0.333 0.262 12 3.7 2 代入公式计算 或者 2、二列相关 两个变量都是正态连续变量,其中一个变量被人为地划分成二分变量,表示这两个变量之间的相关,称为二列相关(biserail correlation)。 将连续变量人为划分为二分变量时,应注意尽量使分界点接近平均数。 二列相关系数的的计算公式 公式中,Y为标准正态分布曲线中与P值对应的纵线高度 其余符号与点二列相关计算公式中含义相同 ( 19.3 ) ( 19.4 ) 例19-2:表8-3是10名学生在一次测验中的卷面总分和一道问答题的得分。该问答题回答是否合格与卷面总分的关系如何?(该问答题满分为10分,规定达到6分为合格) 表19-3 10名学生某题得分与卷面总分 学生 A B C D E F G H I J 卷面总分 75 57 73 65 67 56 63 61 65 67 问答题分 7 6 7 4 7 4 4 4 7 6 计算: SX=6.12,p=0.6, q=0.4, 查正态分布表,当 p=0.60时,Y=0.38667 3.多系列相关(选学) 当两个变量都是正态连续变量,其中一个变量按不同质被人为地分成多种类别(两类以上)的正态名义变量。表示正态连续变量与多类正态名义变量之间的相关,称为多系列相关( multiserials correlation )。 二、品质相关 两个变量都是按性质划分成几种类别,表示这两个变量之间的相关称为品质相关。 品质相关处理的一般是计数数据而不是连续数据,主要用于双向表或称为列联表(R×C表)。 品质相关的方法有多种,最常用的是Φ相关和列联相关。 1、Φ相关 当两个变量都是二分名义变量,这两个变量之间的关系,可以用Φ相关来讨论(两个变量都是人为二分变量的情况除外)。 Φ相关系数用 表示。 当两个变量都各分为两类时,数据在统计表中占有四个单元格,因此这类统计表又称为四格表。Φ相关就适用于四格表。 四格表的一般形式 变量X X1 X2 合 计 变量 Y Y1 a b a+b Y2 c d c+d 合计 a+c b+d n=a+b+c+d Φ相关系数计算公式 ( 19.5 ) a b a+b c d c+d a+c b+d 巧记公式: P144 例5-14: 关于吸烟与患癌症之间关系数据的四格表 癌症(0) 其他(1) 吸烟者(0) 6 4 非吸烟者(1) 3 7 从高中入学考试的英语试卷中抽取100份,并将成绩分为中等以上和中等以下。其中男生中等以上的有15人,中等以下的有31人;女生中等以上的有36人,中等以下的有18人。问英语测验成绩与

文档评论(0)

子不语 + 关注
官方认证
服务提供商

平安喜乐网络服务,专业制作各类课件,总结,范文等文档,在能力范围内尽量做到有求必应,感谢

认证主体菏泽喜乐网络科技有限公司
IP属地山东
统一社会信用代码/组织机构代码
91371726MA7HJ4DL48

1亿VIP精品文档

相关文档