第三章 简化两个变项的分布.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 简化两个变项的分布

第三章 第一节 什么是相关? 是指一个变量的值与另一个变量的值有连带性,即,如果一个变量的值发生变化,另一个变量的值也有变化,则两个变量就是相关了。 一、相关测量的内容 1、相关程度的强弱 2、相关的方向 3、因果关系 1、相关程度强弱 可以用统计法予以测量,指标是相关系数,相关程度强弱用来分析两个因素相关的密切程度 大多数的统计法是以0代表无相关,以1代表全相关 -1 相关系数 1或0 相关系数 1 2、相关方向 针对定序、定距变量而言,定类变量无方向。 所谓正相关(或称正比)是指一个变量的值增加时,另一变量的值也增加。 所谓负相关(或称反比)是指一个变量的值增加时,另一变量的值却减少。 3、因果关系 分析两个变量的关系时,除了要注意强弱与方向这两种性质外,也要注意两个变量是否有因果关系。 自变量与因变量的关系可表示为 X?Y 不对称关系 如:性别?吸烟 也有可能互为因果:X?Y 例:同学间交往频次?友谊程度 二、相关测量种类 1.从变量或现象多少看 单相关X与Y 复相关 两个以 上影响一个变量 2.从变量变化的形式看 直线相关 曲线相关 3.从测量层次上看 定类-----定类 定序-----定序 定距-----定距 定类-----定序 定类-----定距 定序-----定距 第二节 一、交互分类 所谓交互分类,就是同时依据两个变量的值,将所研究的个案分类 。 例如: 某地区调查100名青年人的最大志愿,假定教育水平高的人,选择快乐家庭的5人,理想工作的0人,增广见闻的5人;教育水平中等的快乐家庭30人,理想工作的30人,增广见闻的0人;教育水平低的,快乐家庭5人,理想工作的20人,增广见闻的5人。 表3.1 100名青年人教育水平与志愿 结合了两个变量的共同分布,通常称为列联表 从上表中,我们可以清楚知道在每种教育条件下志愿的次数分布情况。因此,这样的表又称为条件次数表。 在表的最下端是每级教育水平的总次数,称为边缘次数,它们的分布情况就称为边缘分布。 表中的其他次数,称为条件次数,表示在自变量的每个值(条件)的情况下因变量的各个值的个案数目(次数)  条件次数表有大小之分 如果我们将因变量放于表的左边,自变量放于表的上端,则表的大小就是横行数目(r)乘上纵列数目(c),即表的大小为RxC。这个先后次序的用意,是表示前者(因变量)是受后者(自变量)影响的。 如果 教育水平由三级变为两级,但志愿的分类不变,则表的大小为3×2 即: r为因变量的取值类型数(行数) c为自变量的取值类型数(列数) 二维列联表一般形式如下: 二、条件百分表–––––结论表 条件次数表的缺点,是难于比较不同条件下的次数分布,是因为作为基数的边缘次数各有不同。 因此,为追求相互比较,从而知道两个变量间的关系,就必须将各个基数标准化,即在相同的基础上作比较。 最常用的标准化方法,是将所有基数变成100,各个条件次数就随而变为百分率,这样制成的表,就是条件百分表。 表3.2 青年人的教育水平对其志愿的影响 上表的结论: 低等教育水平的青年比其他教育水平的青年更以工作为重,高等教育与中等教育水平的青年都重视家庭,但前者比后者更重视见闻,而后者比前者更重视工作情况,总的说来,如果青年人的教育水平不同,他们的最大志愿也会有分别。教育是决定青年人志愿的因素之一。 三、百分率的计算方向 应该从哪一个方向计算百分率? 常用的规则是:根据自变量的方向(即纵向百分比或列百分比) 如果因变量在样本内的分布不能代表其在总体内的分布,则百分率的计算要根据因变量的方向,即不在等比情况下抽样。 例: 我们在某城市研究破裂家庭(自变量)对青少年犯罪行为(因变量)的影响 ,如何抽样呢? 假定该城市的全部青少年人口中,未犯罪的青少年有54400名,犯罪青少年有960名,我们决定从未犯罪的青少年中抽出百分之一来研究,即544名。从两名犯罪青少年中抽出一名来研究,于是变为480名。假如这样一个样本犯罪与未犯罪的比例为480:544 =1:1.3,实际上总体的犯罪与未犯罪的比例为960:5440=1:56.67,显然样本不能代表总体。 假定样本收集的资料,次数分布如下: 依据自变量状况计算百分率 家庭对青少年犯罪行为的影响 从上表可知: 犯罪青少年中,破裂家庭占30.4%,大于未犯罪青少年的比率(8.3%),证明家庭破裂是会引起青少年犯罪的。 总的来说: 绘制条件百分表时,通常是依据自变量的方向来计算百分率,但如果自变量缺乏代表性,就要根据因变量的

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档