- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
偏 态 偏态(skewness) 统计学家Pearson于1895年首次提出 数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 偏态系数 0为左偏分布 偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.5~1或-1~-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低 偏态系数 (coefficient of skewness) 根据原始数据计算 根据分组数据计算 偏态系数 (例题分析) 某电脑公司销售量偏态及峰度计算表 按销售量份组(台) 组中值(Mi) 频数 fi 140 ~ 150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~190 190 ~200 200 ~210 210 ~220 220 ~ 230 230 ~ 240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 -256000 -243000 -128000 -27000 0 17000 80000 216000 256000 625000 7290000 2560000 270000 0 170000 1600000 648000031250000 合计 — 120 540000 偏态系数 (例题分析) 结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数 峰 态 峰态(kurtosis) 统计学家Pearson于1905年首次提出 数据分布扁平程度的测度 峰态系数=0扁平峰度适中 峰态系数0为扁平分布 峰态系数0为尖峰分布 峰态系数 (coefficient of kurtosis) 根据原始数据计算 根据分组数据计算 峰态系数 (例题分析) 结论:偏态系数为负值,但与0的差异不大,说明电脑销售量为轻微扁平分布 * 数值型数据:方差和标准差 极差(range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 R = max(xi) - min(xi) 计算公式为 【注意】 1、在实际工作中,极差可以用于检查产品质量的稳定性和进行质量控制。在正常生产的条件下,产品质量稳定,极差在一定范围内波动,若极差超过给定的范围,就说明有不正常情况产伤。 2、极差受到极端值的影响,不能反映中间数据的分散状况因此测定结果往往不能反映数据的实际离散程度。 四分位差? 1、四分位差是对极差的一种改进。与极差相比,四分位差因不受极值的影响,在反映数据的离散程度方面比极差准确,具有较高的稳定性;同时,对于存在开口的组距数列,不能计算极差,但可以计算四分位差。 四分位差与极差相比较: 2、四分位差和极差一样,不能充分利用数据的全部信息,也无法反映标志值的一般变动。 【练习】计算下列数据的极差 1,6,6,6,6,6,10 1,3,4,7,8,9,10 问题:那一组数据数据的差异大一些?如何判断? 平均差(mean deviation) 各变量值与其平均数离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少 计算公式为 未分组数据 组距分组数据 平均差 (例题分析) 某电脑公司销售量数据平均差计算表 按销售量分组 组中值(Mi) 频数(fi) 140~150 150 ~ 160 160 ~ 170 170 ~ 180 180 ~ 190 190 ~ 200 200 ~ 210 210 ~ 220 220 ~ 230 230 ~ 240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 40 30 20 10 0 10 20 30 40 50 160 270 320 270 0 170 200 240 160 250 合计 — 120 — 2040 平均差 (例题分析) 含义:每一天的销售量平均数相比, 平均相差17台 ? 优点:能较好地区别出不同组数据的分散情况或程度; 缺点:是绝对值不适合作进一步 方差和标准差(variance and standard deviation) 数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为
文档评论(0)