- 1、本文档共67页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
厦门大学社会学系 第五讲:单变量描述统计 集中趋势测量 & 离散趋势测量 知识点:两个维度——七个统计量数 学习要求 1、集中趋势各测量法的计算方法; 2、集中趋势各测量法的特点和应用; 3、离散程度各测量法的计算方法; 4、离散程度各测量法的特点与应用; 单变量描述统计 在统计分析中,是否可以找出一个有代表性的数值来说明变量的分布,反映资料的集中或差异情况? 集中趋势测量,就是以一个数值来代表变量的资料分布,反映的是变量值向中心值聚集的程度,也就是说以这一个数值(或称典型值)来估计或预测每一个研究对象的数值时发生的错误总数在理论上是最小的。 离散趋势测量(Measures of dispersion)就是用一个值表示数据之间的差异情况。 离散趋势测量法和集中趋势测量法具有互补作用。在进行统计分析时,既要测量变量的集中趋势,也要测量离散趋势。 集中趋势测量/分析 集中趋势测量:用某一个典型的变量值或特征值来代表全体变量的问题,这个典型的变量值或特征值就称作集中值或集中趋势。 ★ 众值(Mode) ——定类层次 ★ 中位值(Median)——定序层次 ★ 均值(Mean) ——定距层次 一、众数(mode) 1、出现频次最多的变量值; 2、众数的不唯一性; 3、主要应用于定类变量,当然也可以应用于定序和定距变量 众数的特点:不唯一性 原始数据:4、5、7、8、19(无众值) 原始数据:4、5、7、5、5、16(一个众值) 原始数据:4、4、5、7、7、9(两个众值) 例1:非连续取值 例2 分组数据 从分布来看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值及为众数。 二、中位值(Median) 1、把一组数据按顺序排列,处于中间位置的那个数值就是中位值。 2、主要应用于定序变量,也可用于定距变量,但不可用于定类变量。 (1)未分组数据求中位数: Md位置= (2)中位数=中间位置的值 注意:先找位置,再找中位数 将各个个案由低至高排列起来,居序列中央位置的个案值就是中位值。 (1)、个案数为奇数 【例1】:甲地的5户人家的人数为:2,4,3,6,8,求中位值。 解:Md的位置= = =3 (2)个案数为偶数 【例2】:乙地的6户人家的人数为:2,4,3,6,8,5求中位值。 解:Md的位置= = =3.5 (3)频数分布表 【例3】根据下表求中位值。 解:Md位置 = = =250.5 中位值Md=乙 2、分组数据 根据统计表中的累积百分比,找出含有50%的区间 找出含有50%区间的上界值U,下界值L,上界累计百分数U%,下界累计百分数L%以及组距等信息 根据线段对应成比例的原理,计算出累计百分比为50%的变量值 L:中位数组的下限 f:中位数组的频数 w:中位数组的组距(U-L) cf:低于中位数组下限的累加次数 n:全部个案数 Md位置=n/2 (上下各50%的位置) 例:分组数据: 首先将各组的次数累加起来 求中位数的位置: Md位置=n/2 =212/2=106 第106个位置在 25-35之间 分组变量看作是一组连续的数值 【例4】: 根据下表数据求中位值。 解:Md位置=50; 从累积频数cf栏找到中位数位置所在组为“300-400” 引入公式: 三、均值 1、均值的定义:总体各单位取值之和除以总体单位数目。 2、仅适用于定距变量,不适用于定类和定序; 1、未分组数据 (1)简单原始资料求均值 均值的计算——未分组数据 【例5】某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。 解:根据平均数的计算公式有: (2)、加权平均数 某个变项值重复出现多次,可以先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权数,f/n称为权重) 公式: 未分组数据加权平均数 【例6】调查某年120名学生的年龄,结果如下表,求平均年龄。 解:根据公式得 =18.9岁 2、分组资料求均值:根据组中值求均值 先求出组中值 组中值=(上限+下限)/2 计算组中值的和 计算分组数据的均值 众值、中位数和均值的比较1 众数、中位数和平均值的比较 众数是一组数据中出现次数最多的数值。但在社会调查中
文档评论(0)