- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四讲 集中趋势测量
2018年11月8日
集中趋势和离散趋势都是简化单一变项分布的技术;
所谓集中趋势,就是指一组数据向某一中心值靠拢的倾向;
而集中趋势测量,就是寻找一个能展示数据一般水平的代表值(或典型值);
对于任一变量,都需先判断其测量层次,再决定集中趋势测量法。
背景知识
定类变量
定序变量
定距变量
目 录
第
一
章
节
di
yi
zhang
jie
众数
众数是出现频次最多的变量值
众数具有不唯一性
众数主要应用于定类变量
众数(Mode)
定类变量的众数
定序变量的众数
分组数据的众数
收入(元)
f
Cf↑
Cf↓
500-699
10
10
550
700-899
65
75
540
900-1099
126
211
475
1100-1299
158
369
339
1300-1499
141
510
181
1500-1699
40
550
40
总数
550
李沛良:
众数是“1100-1299元”
张小山:
众数是组中值,即1200元
众数的不唯一性
在一组数据中,众数既可能不存在,也可能不止一个;
例如:
原始数据:2 3 4 5 6 7 8 0(无众数)
原始数据:2 3 1 5 3 4 2 3(一个众数,3)
原始数据:1 3 4 4 7 2 7 6(两个众数,4和7)
第
二
章
节
di
er
zhang
jie
中位数
把一组数据按顺序排列,处于中间位置的就是中位数;
一般用于定序变量,也可用于定距变量,但不能用于定类变量;
以中位数来估计定序资料,所犯错误总和最小
中位数(Median)
1.未分组数据的中位数
计算中位数位置公式:
Md位置=(n+1)/2
n为个案数
中位数是中位数位置上对应的变量取值
(1)个案数为奇数
例:在甲社区随机抽出7个家庭,其家庭人口数分别为2,4,3,3,6,5,7,求中位数
解:(1)排序2,3,3,4,5,6,7
(2)Md的位置=(n+1)/2=4
(3)Md值为4
(2)个案数为偶数
例:在乙社区随机抽出8个家庭,其家庭人口数分别为2,4,3,3,8,6,5,7,求中位数
解:(1)排序2,3,3,4,5,6,7,8
(2)Md的位置=(n+1)/2=4.5,即Md位于第4位和第5位之间;
(3)数列中第4位是4,第5位是5,所以:
中位数Md=(4+5)/2=4.5
(3)频数分布表
在数据排序时,如果有很多相同的变量取值,可以先建立频数分布表,再求中位数
2.分组数据的中位数
计算累积频数
确定中位数所在组
计算中位数
L:中位数组的真实下限
f:中位数组的频数
w:中位数组的组距(U-L)
cf:低于中位数组下限的累加次数
n:全部个案数
Md位置=n/2 (上下各50%的位置)
计算举例
(1)将各组频数累加;
(2)计算中位数位置
Md位置=80/2=40
(3)根据公式计算Md
Md=1999.5+[(40-20)/40]*(2499.5-1999.5)=2249.5(约等于2250)
练习
根据学生的成绩分布表,计算学生成绩的中位数
第
三
章
节
di
san
zhang
jie
平均数
总体各单位取值之和除以总体单位数目;
可用于定距变量,不可用于定类和定序变量;
以均值来估计定距变量的资料,所犯错误总和最小。
平均数(Mean)
1.未分组数据的平均数
(1)简单原始资料求平均值
某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。
(2)加权平均
某个变项值重复出现多次,可以先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权重)
2.分组数据的平均数
先计算每组的组中值,然后根据组中值计算平均数
(1)先计算各组组中值;
(2)计算组中值的和;
(3)计算平均数
第
四
章
节
di
si
zhang
jie
众数、中位数、平均数比较
是一组数据分布的峰值,不受极端值影响,具有不唯一性
是一组数据中间位置的对应值,不受极端值的影响
具有优良的数学性质,应用广泛。缺点是易受极端值影响
众数、中位数和均值的特点
注意
有两种情不适合用均值:
(1)分组数据的极端组没有组限;
(2)个别数值非常特殊。
*表示这一数据类型最适合的测量值
数据的测量层次与测量值
Thanks
文档评论(0)