单变量统计分析.pptVIP

下载本文档

211
0
约8.95千字
约 76页
2018-04-18 发布于浙江
举报
版权申诉

单变量统计分析.ppt

1、本文档共76页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

二、交互分类社会调查中大量的变量都属于定类或定序层次的变量，交互分类则是一种专门用来分析两个定类变量（或一个定类、一个定序变量）之间关系的方法。 1、交互分类的意义与作用 2、交互分类表的形式要求 3、x2检验 4、关系强度的测量 1．交互分类的意义与作用所谓交互分类，就是将调查所得的一组数据按照两个不同的变量进行综合的分类。交互分类的结果通常以交互分类表(又称列联表)的形式反映出来。作用1：可以较为深入地描述样本资料的分布状况和内在结构。 * 调查人数赞成（%）反对（%）不表态（%）男 1000 85 10 5 女 1000 5 80 15 表10-3 不同性别的人们对某政策的态度统计表调查人数赞成（%）反对（%）不表态（%） 2000 45 45 10 表10-2 人们对某政策的态度统计表作用2：对变量之间的关系进行分析和解释。比例（%）比例（%） 2．交互分类表的形式要求 ①每个表的顶端要有表号和标题。 ②表格中的线条一定要规范，简洁，最好不用竖线。 ③表中的百分比符号的处理方法。 ④在表的下端用括号标出每一纵栏所对应的频数。 ⑤表内的百分比通常保留一位小数。 ⑥自变量与因变量的位置。 ⑦交互分类的两个变量的变量值不宜太多。 3．X2检验为了便于分析交量间的关系，一般是采用相对频数即百分比的形式列出交互分类表。这样，既可以很直观地比较某一变量的不同类别在另一变量上的分布情况，也可以从中推断二者之间的关系。要保证样本中所体现的变量间关系也反映总体的情况，就必须对它们进行X2检验（读作卡方检验）。 X2检验的计算公式式中，f0为交互分类表中每一格的观察频数，fe为交互分类表中f0所对应的期望颇数。 χ2检验的具体步骤（以上表为例）： ①建立两变量间无关系的假设，即设年龄及对某事件的态度两变量相互独立，互不相关。 ②计算出χ2值。 ③根据自由度 df=(r一1)(c－1)和给出的显著性水平，即 P值，查χ2分布表，得到临界值。 ④比较χ2值与临界值。 ⑤判断：a)若χ2值≥临界值，拒绝两变量无关系的假设。 b)若χ2值临界值，接受两变量无关系的假设。以表10-8为例： 1、设年龄与对提前退休的态度两变量相互独立，互不相关。 2、X2＝68．36 3、自由度为：df＝(2-1)(3-1)＝2。假定给出的显著性水平为P＝0．05，由书后的x2分布表可查得临界值为5．991。 4、X2＝68．36＞5．991 5、所以我们可以否定年龄与对提前退休的态度之间无关系的假设，得出在总体中二者有关系的结论。对于交互分类来说，x2检验发挥着这样两种作用：一是对两变量的相关关系是否存在进行审查，此时X2检验又称作独立性检验(即两变量是相互独立，还是彼此相关)；二是对较小规模的样本资料进行差异的显著性检验，即核查交互分类表中所出现的分布差异究竟是由于随机抽样的误差所引起，还是由于总体中的分布状况所导致。 4．关系强度的测量 x2检验检验的是总体中两变量是否存在相关关系；变量间关系的强弱需要用另外的方法进行测量。几种常见的与交互分类有关的变量间关系强度的测量方法： (1) ?系数。 (2) V系数。 (3) c系数(列联系数)。 (4)λ系数。 (4)λ系数。λ系数具有消减误差比例(proportionate reduction in error简称PRE)的意义。 PRE越大，表示以x值去预测Y值时能够减少的误差所占的比例越大，换句话说，X与Y之间就越是相关，或者说，x与y的关系越强。 λ系数的基本特点是以众值作为预测的准则。其计算公式为: 式中，?y表示变量x的每一个值之下变量y的众值，Fy表示变量y的边际分布中的众值。 λ系数的优点是具有PRE意义，但其缺点是仅利用众值资料。当表中的众值都集中在同一行时，λ系数就会等于零。在这种情况下，可采用Tau-y系数(简记为τy)来进行测量。三、其他层次变量的相关测量与检验 1、定序变量与定序变量 Gamma系数 2、定类变量（或定序变量）与定距变量相关比率E2或eta系数 3、定距变量与定距变量皮尔森相关系数 3、定距变量与定距变量测量两个定距变量相关系数的一个最常用指标是皮尔森相关系数，用r表示，其公式为：它具有这样几个特点： 1.公式中x与y是对等的，即将两者的位置互换，r的值不变 2.r的取值范围在-1到+1之间 3.r的取值具有方向性。 4.r本身不具有消减误差比例的意义，但其平方（又称决定系数）具有消减误差比例的意义。表10-19 10名工人的年龄与收入统计表工人代号 1 2 3 4 5 6 7 8 9 10 年龄（岁） 25 32