用样本的数字特征估计总体的数字特征中位数众数平均数.ppt

用样本的数字特征估计总体的数字特征中位数众数平均数.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用样本的数字特征估计总体的数字特征中位数众数平均数

* * 一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组数=极差/组距 三、分组,通常对组内数值所在区间,   取左闭右开区间,最后一组取闭区间 四、登记频数,计算频率,列出频率分布表 五、画出频率分布直方图(纵轴表示频率/组距) 复习回顾 画频率分布直方图的步骤: 连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图 总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具. 画茎叶图的步骤: (1)将每个数据分为茎(高位)和叶(低位)两部分; (2)将最小茎和最大茎之间的数按大小次序排成一列, 写在一侧; (3)将各个数据的叶按大小次序写在其茎的另一侧. 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 二、众数、中位数、平均数与频率分布直方图的关系 问题:在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数? 取最高矩形下端 中点的横坐标 2.25作为众数. 因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标. 频率 组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 分析:在样本数据中,有的个体小于或等于中位数,也有的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等. 频率 组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 频率 组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 思考七、将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数.由此估计总体的平均数是什么? 频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关. 注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征. 思考九、一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗? 如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低. 思考十、样本数据的平均数大于(或小于)中位数说明什么问题? 平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值. 思考十一、怎样理解“我们单位的收入水平比别的单位高”这句话的含义? 这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数. 对众数,中位数,平均数估计总体数字特征的认识: 1、样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息. 2、中位数不受少数几个极端值的影响,容易计算,它仅利用了数据排在中间的数据的信息. 3、样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息. 例:某公司的33名职工的月工资(单位:元)如下表: (1)求该公司职工月工资的平均数、中位数、众数. (2)若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么? (3)你认为哪个统计量更能反映这个公司员工的工资水平? 职务 董事长 副董事长 董事 总经理 经理 管理 职员 人数 1 1 2 1 5 3 20 工资 5500 5000 3500 3000 2500 2000 1500 解析:(1)公司职工月工

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档