第三章集中量数要点.pptxVIP

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章集中量数;如何能够快速的了解一组数据? 集中量数与差异量数 集中量数表现的是数据的集中趋势,指数据分布中大量数据向某方向集中的程度 差异量数表现的是数据的离中趋势,指数据分布中数据彼此分离的程度 通过集中量数与差异量数可以描述或反映一组数据的全貌及其各种统计特征 ;集中量数;?;?; (二)数据值大,利用估计平均数来简化计算 条件:如果数据数目及每个观测数据值都很大时,利用估计平均数来简化计算。 具体方法是先设定一个估计平均数,用符号AM表示,从每一个数据中减去AM,计算出平均数后再加上估计平均数;?;三、特点 (一)离均差的和等于0,即在一组数据中每个变量与平均数做差后,再求其总和等于0 (二)在一组数据中,每一个数据都加上一个常数C,所得的平均数为原来的平均数加常数C (三)在一组数据中,每一个数都乘以一个常数C,所得的平均数为原来的平均数乘以常数C (四)离均差的平方和最小 四、意义 在大多数情况下,真值的渐近与最佳估计值 ;五、优缺点 (一)优点 1、反应灵敏,观测数据中任何一个数值或大或小的变化,在计算平均数时都能反映出来。 2、计算严密,有确定的公式,只要是同一组观测数据,计算的平均数都相同 3、计算简单,应用简单的四则运算 4、简单明了,容易理解 5、适合于进一步用代数方法演算。在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数 6、较少受抽样变动的影响(观测样本的大小或个体的变化,对计算平均数影响很小) ;(二)缺点 1易受极端数据的影响 举例:一个重点班的50名水平相当的学生,在通过一项教育测验时,绝大多数学生得分较高,但个别人由于身体不适或情绪不良得到很低的分数,这时若用平均数代表全班学生的知识水平,则肯定偏低。 处理方式:修剪平均数——从一组数据中去除一定百分比(5%)的最大值和最小值数据后,再计算算数平均数(见下页例子);在中央电视台举办的一次全国业余通俗歌手大赛中,假定11位裁判对某位歌手的评分按顺序排列为:9.9,9.3,9.3,9.3,9.2,8.9,8.8,8.8,8.5,8.4,7.4;2、若出现模糊不清的数据时,无法计算平均数,这时一般采用中数作为该组数据的代表值 3、数据不同质时也不宜使用算数平均数 (数据同质:使用同一个观测手段,采用同样的观测标准,能反映某一问题的同一方面特质的数据);六、计算和应用平均数的原则 (一)同质性原则 同质数据:使用同一观测手段,采用相同的观测标准,能反映某一问题的统一方面特质的数据。 高考各科分数相加,计算平均分不能代表该生的水平 (二)平均数与个体数值相结合的原则 平均数作为整个总体的综合特征,它能够用一个抽象的代表数值反映客观事物的一般水平。但一个总体是由若干个千差万别的个别事物构成的,若要全面而正确的认识这些客观事物,要结合个体数值予以参考 ;(三)平均数与标准差、方差相结合原则 平均数反映的是总体数据的集中趋势,但平均数对于总体数据一般水平的代表性如何,要看各个数值之间差异的大小。数据差异大,平均数的代表性就小,差异小,平均数的代表性就大。; 第二节中数(median) 一、定义 中数又称中位数,中值,符号为Md或Mdn,指的是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。 ;?;2、一组数据中有重复数值时 (1)重复数值没有位于数列中间,不管数据总数是奇数还是偶数,求中数的方法与无重复数据时的求法一样 举例:5,6,6,12,10,15,17 (2)重复数值位于数列中间 数据的个数为奇数时,中数所在位置为(N+1)/2 A、由于该位置的数值为重复数目,所以将其视为占据了一个分数单位的全距,然后被重复几次就划分为几份,求出中间位置数值所占的具体区间后,取区间的组中值即为该组数据的中数 举例:11,11,11,11,13,13,13,13,17,17,17 ;B、数据个数为偶数时,N/2与(N+1)/2位置的数据相加除以2 即为(N/2位置的组中值加上N+1/2位置的组中值)/2 其实正好是N/2位置数据的组上限或者(N+1)/2位置数据的组下限 举例:11,11,11,11,13,13,13,17,17,18;?;举例;遗留问题:分组数据中N为偶数,如果N为奇数呢? 其它教材上也没考虑这个问题?;三、优缺点 (一)优点 1计算简单,容易理解 2概念简单明白 (二)缺点 1中数的计算不是每个数据都加入,所以其大小没有考虑全体数据 2反应不够灵敏, 极端值的变化对中数不产生影响 3受抽样影响大,不如平均数稳定 4计算时需要对数据先排列大小 5中数乘以总数与数据的总和不相等 6中数不能做进一

文档评论(0)

麻将 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档