试议统计资料的综合.pptx

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
表示统计资料的特征数有哪些? 几何平均数与调和平均数各适合于什么情况? 计算样本方差与总体方差公式有何区别?;3.1 表示集中位置的特征数;定义: 一组n个观测值x1,x2 ,…,xn的算术平均数,定义为 ;如果资料已经分组,组数为k,用x1,x2 ,…,xk 表示各组中点,f1,f2…,fk 表示相应的频数,那么 ;表3-1 某校125位大学一年级新生体重表;其平均体重:; ;在数据为环比类型的问题中,算术平均数是不适用的。例如下表是天津市工业总产值在“十五”期间的逐年增长率,如求该期间平均增长率,算术平均数是不恰当的。几何平均数可以解决这个问题。 ;表3-2 天津市工业总产值;定义: 一组n个数据的几何平均数定义为 ;当数据是相对变化率,求平均数时,算术平均数也不恰当。 例如:甲乙两地相距120公里,某人乘车往返甲乙两地之间,去时速度每小时20公里,回来时速度为每小时30公里,若求平均速度,这时用算术平均数是不对的,但调和平均数可解决此类问题。;;算术平均数表示了集中位置特征,它照顾到每一个值,但它不见得是出现次数最多的值(甚至也可能不是观测值中的一个)。所以有必要研究表示集中位置的其它的特征数。 ;定义:对于有频数分布的变量,它的众数指频数最大的变量的值;算术平均数作为集中位置的特征还有一缺点,就是受观测值中极端值的影响很大,而一组观测值中的极端值常常没有代表性。中位数将避免这种影响。;;第25百分位数又称第一个四分位数(First Quartile) ,用Q1 表示;第50百分位数又称第二个四分位数 (Second Quartile),用Q2表示;第75百分位数 又称第三个四分位数(Third Quartile),用Q3表示。;;数据的变 异程度;定义 其中xmax和xmin分别为数据中的极大值和极小值。;;;标准差;;;3.3.1比较众数、中位数和算术平均数的相对位置 ;图3-1; MeMo;(1)Pearson偏倚系数;; ;;盒形图实际上是以图形来概括数据。我们将盒形图延至这一章才讲是因为它的关键是计算中位数和四分位数Q1和Q3。此外还将用到四分位数间距IQR=Q3-Q1 。 盒形图的画法步骤如下: (1)画一个方盒,其边界恰好是第1和第3四分位数。对于上述的起薪数据, Q1=2365, Q3=2500。 这个方盒包含了中间的50%的数据。 (2)在方盒上中位数的位置画一条垂线(对起薪数据,中位数为2405)。因此中位数将数据分为相等的两个部分。 ;(3)利用四分位数间距IQR=Q3-Q1,来设定界限。盒形图的界限定于低于Q1以下1.5个IQR和高于Q3以上1.5个IQR的位置。上、下限以外的数值作为异常值。 (4)在图3-4中的横线叫做须线(whisker),须线从方盒的边线出发,直至在上、下限之内的最大值和最小值。 (5)最后,任一异常值的位置以符号“*”标出。 ;盒形图例图

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档