社会调查;集中趋势测量.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四讲 集中趋势测量 2018年11月8日 集中趋势和离散趋势都是简化单一变项分布的技术; 所谓集中趋势,就是指一组数据向某一中心值靠拢的倾向; 而集中趋势测量,就是寻找一个能展示数据一般水平的代表值(或典型值); 对于任一变量,都需先判断其测量层次,再决定集中趋势测量法。 背景知识 定类变量 定序变量 定距变量 目 录 第 一 章 节 di yi zhang jie 众数 众数是出现频次最多的变量值 众数具有不唯一性 众数主要应用于定类变量 众数(Mode) 定类变量的众数 定序变量的众数 分组数据的众数 收入(元) f Cf↑ Cf↓ 500-699 10 10 550 700-899 65 75 540 900-1099 126 211 475 1100-1299 158 369 339 1300-1499 141 510 181 1500-1699 40 550 40 总数 550 李沛良: 众数是“1100-1299元” 张小山: 众数是组中值,即1200元 众数的不唯一性 在一组数据中,众数既可能不存在,也可能不止一个; 例如: 原始数据:2 3 4 5 6 7 8 0(无众数) 原始数据:2 3 1 5 3 4 2 3(一个众数,3) 原始数据:1 3 4 4 7 2 7 6(两个众数,4和7) 第 二 章 节 di er zhang jie 中位数 把一组数据按顺序排列,处于中间位置的就是中位数; 一般用于定序变量,也可用于定距变量,但不能用于定类变量; 以中位数来估计定序资料,所犯错误总和最小 中位数(Median) 1.未分组数据的中位数 计算中位数位置公式: Md位置=(n+1)/2 n为个案数 中位数是中位数位置上对应的变量取值 (1)个案数为奇数 例:在甲社区随机抽出7个家庭,其家庭人口数分别为2,4,3,3,6,5,7,求中位数 解:(1)排序2,3,3,4,5,6,7 (2)Md的位置=(n+1)/2=4 (3)Md值为4 (2)个案数为偶数 例:在乙社区随机抽出8个家庭,其家庭人口数分别为2,4,3,3,8,6,5,7,求中位数 解:(1)排序2,3,3,4,5,6,7,8 (2)Md的位置=(n+1)/2=4.5,即Md位于第4位和第5位之间; (3)数列中第4位是4,第5位是5,所以: 中位数Md=(4+5)/2=4.5 (3)频数分布表 在数据排序时,如果有很多相同的变量取值,可以先建立频数分布表,再求中位数 2.分组数据的中位数 计算累积频数 确定中位数所在组 计算中位数 L:中位数组的真实下限 f:中位数组的频数 w:中位数组的组距(U-L) cf:低于中位数组下限的累加次数 n:全部个案数 Md位置=n/2 (上下各50%的位置) 计算举例 (1)将各组频数累加; (2)计算中位数位置 Md位置=80/2=40 (3)根据公式计算Md Md=1999.5+[(40-20)/40]*(2499.5-1999.5)=2249.5(约等于2250) 练习 根据学生的成绩分布表,计算学生成绩的中位数 第 三 章 节 di san zhang jie 平均数 总体各单位取值之和除以总体单位数目; 可用于定距变量,不可用于定类和定序变量; 以均值来估计定距变量的资料,所犯错误总和最小。 平均数(Mean) 1.未分组数据的平均数 (1)简单原始资料求平均值 某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。 (2)加权平均 某个变项值重复出现多次,可以先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权重) 2.分组数据的平均数 先计算每组的组中值,然后根据组中值计算平均数 (1)先计算各组组中值; (2)计算组中值的和; (3)计算平均数 第 四 章 节 di si zhang jie 众数、中位数、平均数比较 是一组数据分布的峰值,不受极端值影响,具有不唯一性 是一组数据中间位置的对应值,不受极端值的影响 具有优良的数学性质,应用广泛。缺点是易受极端值影响 众数、中位数和均值的特点 注意 有两种情不适合用均值: (1)分组数据的极端组没有组限; (2)个别数值非常特殊。 *表示这一数据类型最适合的测量值 数据的测量层次与测量值 Thanks

文档评论(0)

kbook + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档