统计学第3章下.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第3章下

变异系数 (例题分析) 某管理局所属8家企业的产品销售数据 企业编号 产品销售额(万元) x1 销售利润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度 变异系数 (例题分析) 结论: 计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度 v1= 536.25 309.19 =0.577 v2= 32.5215 23.09 =0.710 六、箱线图 是综合表达数据的中心特征和离散特征的图形方法。 箱线图的绘制步骤 1. 将数据值由小到大的顺序排列。 2. 求出中位数Me。 3. 求Q1 和Q3。 4. 将Q1,Me及Q3,绘成一长方形。 5. 找出样本数据中的极小、极大值,画出左、右胡须。 当胡须特别长时(外围值的范围分布很大时),特别是由于个别过大或过小值出现在样本数据集合中时,需对箱形图进行修正,来“剔除”特别大或特别小的数据对箱形图的影响,从而较为恰当地表达样本数据集合的基本特征。 修正的箱线图 修正箱线图中的一些概念 外围值:处在胡须上的、离箱体的距离大于1.5倍的四分位距(1.5Iqr)的样本值。 近外围值:处在胡须上的、离箱体的距离大于1.5倍的四分位距(1.5Iqr)、但小于3倍的四分位距(3Iqr)的样本值。 远外围值(极端值):处在胡须上的、离箱体的距离大于3倍的四分位距(3Iqr)的样本值。 修正箱线图的绘制步骤 1. 将数据值由小到大的顺序排列。 2. 求出中位数Me。 3. 求Q1 和Q3。 4. 求四分位距Iqr,“非外围值”上边界Q3+1.5Iqr,“非外围值”下边界Q1-1.5Iqr。 5. 将Q1,Me及Q3,绘成一长方形。 6. 找出样本数据中“非外围值”范围内的最小值、最大值,画出左、右胡须。 修正箱形图的主要作用 可了解数据分布,是否为对称性; 可清楚指出中位数的位置; 可判断数据有无离群值(奇异值)存在。 箱线图给出了一个数据集合的哪些量? (A)极小值、极大值 (B)极差、中位数 (C)上四分点、下四分点 (D)四分位距 第三节 分布的偏度与峰度 一、动差(矩) 二、偏度(Skewness) 三、峰度(Kurtosis) 3-* 一、矩(动差 ) 动差(矩)—— 一系列刻画数据分布特征的指标的统称。 变量值与数值 a 之离差的 K 次方的平均数称为变量 x 关于 a 的K 阶矩,即: 3-* K 阶原点动差(矩) (当a = 0 时)是数据的K次方的平均数. 一阶原点矩即算术平均数; 二阶原点矩即平方平均数。 K 阶中心动差(矩) (当a =均值 时)是以均值为中心计算的离差 K 次方的平均数。 k=0时,称为零阶中心动差(矩),它恒等于1,即 U0=1; k=1时,称为一阶中心动差(矩),它恒等于0,即 U1=0; k=2时,称为二阶中心动差(矩),也就是方差,即U2=σ2。 偏态与峰态分布的形状 扁平分布 尖峰分布 偏态 峰态 左偏分布 右偏分布 与标准正态分布比较! 二、偏度(Skewness) 偏度——指数据分布的不对称程度或偏斜程度。 以 对称分布 为标准来区分 偏态分布又分左偏(负偏)和右偏(正偏). 左偏分布(负偏) 右偏分布(正偏) 偏度系数 利用 3 阶中心矩除以σ3来计算偏度系数。 测定偏度最常用的方法 原理:若分布不对称,则 3 阶中心矩不为0。不对称程度愈严重, 3 阶中心矩的绝对值愈大。为消除量纲的影响,可除以σ3。 0 对称分布 左偏分布 右偏分布 偏态的其他测度方法 -3 0 +3 极左偏态 对称分布 极右偏态 一般有: 1、由均值与众数(中位数)之间的关系求偏态系数: 2、由三个四分位数之间的关系求偏态系数 值域:-1? Sk ? 1 极左偏态 对称分布 极右偏态 -1 0 +1 三、峰度(Kurtosis) 峰度——是指变量的集中程度和分布曲线的陡峭(或平坦)的程度。 对峰度的度量通常以正态分布曲线为比较标准,分为正态峰度、尖顶峰度和平顶峰度. 扁平分布 尖峰分布 尖顶峰度的分布

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档