网站大量收购独家精品文档,联系QQ:2885784924

用统计量描述数据.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

标准化值

(例题分析)01?经验法则表明:当一组数据对称分布时02约有68%的数据在平均数加减1个标准差的范围之内03约有95%的数据在平均数加减2个标准差的范围之内04约有99%的数据在平均数加减3个标准差的范围之内经验法则如果一组数据不是对称分布,经验法则就不再使用,这时可使用切比雪夫不等式,它对任何分布形状的数据都适用切比雪夫不等式提供的是“下界”,也就是“所占比例至少和多少”对于任意分布形态的数据,根据切比雪夫不等式,至少有的数据落在k个标准差之内。其中k是大于1的任意值,但不一定是整数切比雪夫不等式

(Chebyshev’sinequality)均值(mean)集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响用于数值型数据,不能用于分类数据和顺序数据简单均值与加权均值

(simplemean/weightedmean)设一组数据为:x1,x2,…,xn各组的组中值为:M1,M2,…,Mk相应的频数为:f1,f2,…,fk01简单均值02加权均值03已改至此!!加权平均数

(例题分析)?加权均值

(权数对均值的影响)甲乙两组各有10名学生,他们的考试成绩及其分布数据如下01020304甲组:考试成绩(x): 020100人数分布(f):118乙组:考试成绩(x): 02010005人数分布(f):811均值

(数学性质)各变量值与均值的离差之和等于零各变量值与均值的离差平方和最小调和平均数

(harmonicmean)均值的另一种表现形式易受极端值的影响计算公式为原来只是计算时使用了不同的数据!调和平均数

(例题分析)【例】某蔬菜批发市场三种蔬菜的日成交数据如表,计算三种蔬菜该日的平均批发价格几何平均数

(geometricmean)n个变量值乘积的n次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为5.可看作是均值的一种变形几何平均数

(例题分析)【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。年平均增长率=114.91%-1=14.91%几何平均数

(例题分析)算术平均:几何平均:【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率众数、中位数和均值的比较01众数、中位数和均值的关系左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值不受极端值影响具有不唯一性数据分布偏斜程度较大时应用众数01不受极端值影响数据分布偏斜程度较大时应用中位数02易受极端值影响数学性质优良数据对称分布或接近对称分布时应用均值03众数、中位数和均值的特点和应用数据类型与集中趋势测度值极差和四分位差01方差及标准差02相对位置的测量:标准分数03相对离散程度:离散系数043.2差异(离散程度)的测度数据的特征和测度

(本节位置)数据的特征和测度分布的形状离散程度集中趋势众数中位数均值离散系数方差和标准差峰度四分位差偏态离中趋势数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值极差02极差

(range)一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布7891078910R=max(xi)-min(xi)计算公式为四分位差03四分位差

(quartiledeviation)对顺序数据离散程度的测度也称为内距或四分间距上四分位数与下四分位数之差QD=QU–QL反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性01.如根据例5,计算这10个家庭的人均月收入数据的四分位差为:02.QD=QU–QL=1532.5-772.5=760(元)方差和标准差04方

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档