- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
利用样本数字特征估计总体数字特征
众数、中位数、平均数的概念 中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. 众数:在一组数据中,出现次数最多的数据叫做这组数据的众数. 平均数: 一组数据的算术平均数,即 x= 复习回顾 一、求极差,即数据中最大值与最小值的差 二、决定组距与组数 :组数=极差/组距 三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间 四、登记频数,计算频率,列出频率分布表 五、画出频率分布直方图(纵轴表示频率/组距) 画频率分布直方图的步骤: 教学目标 1.能够通过实例的需求合理的选取样本从样本数据中提取基本的数字特征(平均数、标准差等)。 2.通过分析图表,理解平均数、众数、中位数和方差标准差的意义,了解它们都是数据集中趋势的描述。 3.通过求解平均数等数据以及案例分析,培养学生的数据处理能力,形成对数据处理过程形成初步评价的认识 二、众数、中位数、平均数与频率分布直方图的关系 城市居民月均用水量样本数据的频率分布直方图(P 例1) 频率 组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 众数 中位数 在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。 月均用水量/t 频率 组距 0.5 0.4 0.3 0.2 0.1 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O 平均数 平均数是频率分布直方图的“重心”. 是直方图的平衡点。等于频率分布直方图中每个小矩形的面积(即落在该组中的频率)乘以小矩形底边中点的横坐标(组中值)之和。 频率 组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) - X = 频率 组距 0.1 0.2 0.3 0.4 0.5 O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t) 3、平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 1、平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变 2、平均数可以反映出更多的关于样本数据全体的信息 三种数字特征的优缺点 特征数 优 点 缺 点 众数 体现了样本数据的最大集中点 无法客观反映总体特征 中位数 不受少数极端值的影响 不受少数极端值的影响有时也是缺点 平均数 与每一个数据有关,更能反映全体的信息. 受少数极端值的影响较大,使其在估计总体时的可靠性降低. 例 为了考察甲乙两种观赏灌木的长势,分别从中 抽出10个样本,测得灌木丛高如下(单位:cm): 甲:32,33,34,35,30,36,33,31,35,31; 乙:31,36,37,34,33,39,26,28,30,36; 问:哪种灌木长得比较整齐,更加有利于引进观赏? X甲= ( cm) X乙= (cm) 我们采用各偏差平方的平均数来衡量数据的稳定性, 即 ,叫做这组数据的方差(用S2来表示)。 由方差的定义,要注意: 1、方差是衡量数据稳定性的一个统计量; 2、要求某组数据的方差,要先求数据的平均数; 3、方差的单位是所给数据单位的平方; 4、方差越大,波动越大,越不稳定; 方差越小,波动越小,越稳定。 S2甲= (cm2) S2乙= (cm2) 因为S2甲 S2乙,所以甲种灌木长得比较整齐。更具有观赏性 因此,在选择灌木品种的时候,可以利用方差来判断灌木丛的长势情
文档评论(0)