- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学基础案例
【案例1】
平均数的“平均性”
1994年1月6日,山西日报的两位记者撰文《平均数掩盖贫困户》。文章反映,在一个户人均收入声称达千元的村里,71%的户人均纯收入不到500元,其中不到500元,其中不到350元温饱线的占32%,作者提出,平均数之所以高,是因为村里有6户个体建筑大户的人均收入在3万元以上。1994年3月4日,中国信息报记者撰文:“根据调查测算,1993年我国农民人均纯收入的平均线已向千元大关冲刺,达921.4元,比上年增长137.4元,增长17.5%,值得注意的是,收入水平达此线的只有11个省份,点38%,这一百分数比去年下降了三个百分点,这表明,农民人均收入的平均线并不代表大多数农民的收入水平。”又如中国经济时报2002年3月1日的《质疑“人均”统计数字》一文中报道说,中国房地产协会会长杨慎谈到,“15年来,我国一直用:人均居住面积”来反映居民的住房水平,这一指标是不很科学的。当官的,有钱的永远住的都是大房子,有的别墅售楼广告牌标明200到400平方米,把那些官人和富人阶层的住房面积平均到普通老百姓的头上,这能算的上居民住房水平提高吗?
以上的“人均数“之所以掩盖了贫困户,是由于农户收入中出现了收入特别高和特别低的相差悬殊的情况,而算术平均数计算的均值受极大值的影响比受极小值的影响还要大,所以就使人均收入高起来。而住房”人均居住面积“之所以高,是因为”把那些官人和富人阶层的住房面积平均到普通老百姓的头上。这恰恰暴露了算术平均数运用中局限性,即在现象总体中各个变量值的数字大小差异悬殊的情况下,采用算术平均数的“人均数”代表性不强,不能代表大多数。它没能反映出大多数即村里71%的农户,全国62%的农民收入水平;没能反映出大多数住房困难的百姓的实际情况, 所以这样的平均数实际上掩盖了贫困户和“穷老百姓”。这说明在以上的三种情况下,采用这样不能反映事物现象的本质特征的算术平均数量度计算人数是不合适的,应采用其他的平均数量度方法来计算。
在研究主题,研究目的,研究对象都相同的条件下,采用不同的平均数量度计算方法,所得出的数字结果各异,代表性程度和本质意义不同。以下用一假定实例说明分析。
2001年我国某市下岗居民年收入增加情况(扣除物价上涨因素 单位:元)
年收入增加(x)
产量(f)
按较小制累计人数
xf
0
3000
3000
0
1000
2000
5000
2000000
2000
1800
6800
3600000
3000
1200
8000
3600000
4000
1000
9000
4000000
5000
800
9800
4000000
100000
200
10000合计
10000
根据以上资料,如果从平均数的众数这一量度看,3000人这一组是众数。所对应的下岗工人的年收入的增加额为0。原因可能是我国这几年事业问题严重,很多下岗工人由于各种原因就业困难,所以相当一部分居民户在这一年中收入没有增加。但是如果以这个众数0来代表万户居民户在2001年的收入增加情况,显然不全面,也不符合实际情况,因为表中的资料显示:有70%共7000人的居民户,在这一年中收入有不同程度的增加。所以对于此资料来说,采用众数这个平均数量度来反映居民户年收入的增加情况没有意义。
如果用算术平均数量度来反映以上资料中的万户居民年收入增加情况,所计算的加权平均数结果为3720元。从资料中可以明显看出这个均值的代表性很不强,因为在万户居民中只有20%(2000)户居民的年收入在3720以上,也就是说还有80%(8000户)居民户的收入低于平均数3720元,之所以一户均数这么高,是因为它受到了资料中极大值(200户收入增加额10万元)的影响,所以,用算术平均数量度计算的这个人均数不能真实,全面的代表和反映绝大多数居民户在2001年收入增加情况。
现在我们再用平均数的中位数量度,来计算万户居民户收入增加的一般情况和平均水平。根据计算的累计户数为10000户,可以确定中位数所在的位置是累计次数为5000户这一组:我国某市万户下岗居民在2001年有50%的居民收入的增加额为1000元以上,50%的居民户的收入增加额在1000元以下。
显然,根据以上的资料特点,采用平均数中的中位数量度,比以上的众数和算术平均数量度更能客观,真实的代表和反映万户居民户收入增加的一般情况。因为中位数是总体中所有变量值的按顺序排列后,处在中间位置的那个变量值,它不变极端值(极大值和极小值)的影响。由于中位数量度最适合反映总体中变量值差异悬殊现象的数量特点,所以一般在反映收入的一般水平时,常用中位数计算,美国的人口普查在关于收入的报告中,都使用的是中位数。
文档评论(0)