第三章简化两个变项的分布.pptVIP

下载本文档

14
0
约2.92千字
约 42页
2018-05-22 发布于河南
举报
版权申诉

第三章简化两个变项的分布.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章简化两个变项的分布

第三章第一节什么是相关？是指一个变量的值与另一个变量的值有连带性，即，如果一个变量的值发生变化，另一个变量的值也有变化，则两个变量就是相关了。一、相关测量的内容 1、相关程度的强弱 2、相关的方向 3、因果关系 1、相关程度强弱可以用统计法予以测量，指标是相关系数，相关程度强弱用来分析两个因素相关的密切程度大多数的统计法是以0代表无相关，以1代表全相关 -1 相关系数 1或0 相关系数 1 2、相关方向针对定序、定距变量而言，定类变量无方向。所谓正相关(或称正比)是指一个变量的值增加时，另一变量的值也增加。所谓负相关(或称反比)是指一个变量的值增加时，另一变量的值却减少。 3、因果关系分析两个变量的关系时，除了要注意强弱与方向这两种性质外，也要注意两个变量是否有因果关系。自变量与因变量的关系可表示为 X?Y 不对称关系如：性别?吸烟也有可能互为因果：X?Y 例：同学间交往频次?友谊程度二、相关测量种类 1．从变量或现象多少看单相关X与Y 复相关两个以上影响一个变量 2．从变量变化的形式看直线相关曲线相关 3．从测量层次上看定类-----定类定序-----定序定距-----定距定类-----定序定类-----定距定序-----定距第二节一、交互分类所谓交互分类，就是同时依据两个变量的值，将所研究的个案分类。例如：某地区调查100名青年人的最大志愿，假定教育水平高的人，选择快乐家庭的5人，理想工作的0人，增广见闻的5人；教育水平中等的快乐家庭30人，理想工作的30人，增广见闻的0人;教育水平低的，快乐家庭5人，理想工作的20人,增广见闻的5人。表3.1 100名青年人教育水平与志愿结合了两个变量的共同分布，通常称为列联表从上表中，我们可以清楚知道在每种教育条件下志愿的次数分布情况。因此，这样的表又称为条件次数表。在表的最下端是每级教育水平的总次数，称为边缘次数，它们的分布情况就称为边缘分布。表中的其他次数，称为条件次数，表示在自变量的每个值(条件)的情况下因变量的各个值的个案数目(次数) 　条件次数表有大小之分如果我们将因变量放于表的左边，自变量放于表的上端，则表的大小就是横行数目(r)乘上纵列数目(c)，即表的大小为ＲxC。这个先后次序的用意，是表示前者(因变量)是受后者(自变量)影响的。如果教育水平由三级变为两级，但志愿的分类不变，则表的大小为3×2 即： r为因变量的取值类型数(行数) c为自变量的取值类型数(列数) 二维列联表一般形式如下：二、条件百分表–––––结论表条件次数表的缺点，是难于比较不同条件下的次数分布，是因为作为基数的边缘次数各有不同。因此，为追求相互比较，从而知道两个变量间的关系，就必须将各个基数标准化，即在相同的基础上作比较。最常用的标准化方法，是将所有基数变成100，各个条件次数就随而变为百分率，这样制成的表，就是条件百分表。表3.2 青年人的教育水平对其志愿的影响上表的结论：低等教育水平的青年比其他教育水平的青年更以工作为重，高等教育与中等教育水平的青年都重视家庭，但前者比后者更重视见闻，而后者比前者更重视工作情况，总的说来，如果青年人的教育水平不同，他们的最大志愿也会有分别。教育是决定青年人志愿的因素之一。三、百分率的计算方向应该从哪一个方向计算百分率？常用的规则是：根据自变量的方向(即纵向百分比或列百分比) 如果因变量在样本内的分布不能代表其在总体内的分布，则百分率的计算要根据因变量的方向，即不在等比情况下抽样。例：我们在某城市研究破裂家庭(自变量)对青少年犯罪行为(因变量)的影响，如何抽样呢？假定该城市的全部青少年人口中，未犯罪的青少年有54400名,犯罪青少年有960名，我们决定从未犯罪的青少年中抽出百分之一来研究，即544名。从两名犯罪青少年中抽出一名来研究，于是变为480名。假如这样一个样本犯罪与未犯罪的比例为480：544 =1：1.3,实际上总体的犯罪与未犯罪的比例为960：5440=1：56.67，显然样本不能代表总体。假定样本收集的资料，次数分布如下：依据自变量状况计算百分率家庭对青少年犯罪行为的影响从上表可知：犯罪青少年中，破裂家庭占30.4%，大于未犯罪青少年的比率(8.3%)，证明家庭破裂是会引起青少年犯罪的。总的来说: 绘制条件百分表时，通常是依据自变量的方向来计算百分率，但如果自变量缺乏代表性，就要根据因变量的

您可能关注的文档

文档评论（0）

jgx3536 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6111134150000003

1亿VIP精品文档

更多 >

第三章简化两个变项的分布.pptVIP