第六章-单变量分析分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章-单变量分析分析

第六章 单变量统计分析 本章基本内容 一、资料简化的基本技术 二、集中趋势测量 三、离散趋势测量 四、单变量推论统计 一、资料简化的基本技术 1、频数分布 2、频率分布 3、 累加频数和累加百分率 4、对比值 所谓频数分布(Frequency Distribution),是指一组数据中取不同值的个案的次数分布情况,通常以频数分布表的形式表达。 频数分布表的主要作用是简化资料,可以清楚地了解到调查数据所放映出的信息。 2、频率分布(简写%) 所谓频率分布(Percentages Distribution),指的就是一组数据中不同取值的频数相对于总数的比率分布情况。 频数分布是不同类别在总体中的绝对数量分布,而频率分布则是不同类别在总体中的相对分布(相对比重)。 通过频率分布,可以比较同一类别在不同整体中的分布情况的异同。 累加次数(简写成cf),就是把次数向上或向下逐级累加起来,向上的叫向上累加次数(cf↑),向下的叫向下累加次数(cf↓)。 累加百分率(简写成c%),就是把各级的百分率数值向上或向下逐级累加起来。 适用于定序、定距层次而不适用于定类层次的统计分析方法。 4、对比值 所谓对比值就是两变量值的比值。 例如某大学有男生18000人、女生6000人,则该校男生与女生的对比值就是3:1,即每有1名女生就有3名男生。 新生人口的性别比通常用对比值表示。如新生婴儿性别比为108,即表示新生男、女婴儿比为108 :100,亦即每出生100名女婴,就有108名男婴出生。 比 例: 百分率: 千分率: 万分率: 二、集中趋势测量 所谓集中趋势测量法,就是找出一个典型值或代表值来代表变量的分布,以反映这组数据向这个典型值集结的情况。 当根据这个典型值来估计或预测每个研究对象(即个案)的数值时,所发生的错误的总和是最小的。 1.定类变量:众数(Mode) 2.定序变量:中位数(Median) 3.定距变量:均值(Mean) 所谓众数(简写成Mo),简单说就是一组数据中出现次数最多的值。 求众数的步骤是这样: 首先将原始数据制成频数分布表; 然后在频数一栏中找出最大的频数; 最后找到最大的频数所对应的标志值,这一标志值就是众数。 由组距分组资料求众数的方法:组中值法 首先也通过观察找出最高的频数; 然后根据最高的频数找到它所对应的组; 最后求出该组的组中值即为众数。 众数适合于分析定类变量,当然也可以用来分析定序、定距变量的资料。 所谓中位数(简写成Md),就是在一个按值的大小顺序排列的序列中位于中央位置的哪个数值。 其意义是:在整个数据中,有一半数据的值在它之上(比它大),另一半数据的值在它之下(比它小)。 求算中位数的步骤是:先将各个数值按由小到大的顺序排列起来,然后找出位于中央位置的那个值,即中位数。 某班5名学生的年龄由小到大排列如下: 16,17,18,19,20 Md位置= 某班有6名学生,其年龄由小到大分别是:16,17,18,19,20,21 则Md位置=(6+1)/2=3.5, 即中央位置位于第三学生和第四学生之间, 所以Md=(18+19)/2=18.5。 在一组数据中,可能有许多相同的数值。如果是这种情况,可以先统计出次数分布,然后求出中位数。 其步骤也是先求出数据序列的中间位置,然后再找出其所对应的值即中位数。 某班有35名学生,其年龄分布在17—20岁之间,各年龄的人数如表4-8所示。求该班学生年龄分布的中位数? 第一步是先算出中位数所在的中央位置:Md位置=(35+1)/2=18,即第18个数值所在位置。 第二步就是列出累加次数,可以从上到下列出向上累加次数(如表中第三列),也可以从下往上列出向下累加次数(如表中第四列)。 第三步我们从上往下找(或从下往上找),看所计算出的中间位置最先落入哪个累加次数内,再由此找出相对应的中位数。 具体方法是先列出累加次数,然后按上述方法确定中位数所在的组,最后利用下述公式计算出中位数的值: 中位数Md= L为中位数所在组的下限值,N为全部个案数目, 为中位数所在组的频数, 为中位数所在组以下的累加次数,w为中位数所在组的组距。 在社会调查中,均值即平均数是使用的最多的统计值。 定距变量数据可以做加减运算,因此可以将变量的各个数值加起来,所得之和再除以调查对象数目,求得一个平均的数值,这就是平均数(简写成 )。 (1)根据原始数据求算平均数。这种情况下求算平均数的公式是: 某班8名学生的年龄分别是: 18、19、20、21、20、18、17 根据公式他们的平均年龄是: =(18+19+19+20+21

文档评论(0)

wbjsn + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档