简明应用统计学第2版第3章描述数.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简明应用统计学第2版第3章描述数.pptx

简明应用统计学(第2版)第 3 章 描述数据:如何用少量数字概括数据3.1 引言3.2集中趋势的数字度量 3.3离散程度的数字度量3.4分布形态的度量:偏度与峰度3.5相对位置的数字度量:标准得分和标准化3.6异常值检测学习目标掌握如何度量数据的集中趋势和离散程度;知道如何度量分布的形态和相对位置;了解异常值检测;相关理论在统计学软件中的应用;相应的统计分析结果的解读。3.1 引言在许多情况下,我们常常需要用几个简单的数字来“浓缩”概括具有很多数字的变量或指标。比如,我们说北京人的人均收入是多少,大学生占人口的百分比,等等。这些 “人均收入”、“百分比”的数字就是对大量观测数据的概括。由于定性变量主要是计数,常用的概括方法就是比例、百分比以及频数等,在第2章中已经涉及。我们在这里主要介绍定量变量的数字描述。汇总统计量或概括统计量(summary statistic)用来描述定量变量的数据。它们是从样本数据得来的,因而也是样本的函数,任何样本的函数,只要不包含总体的未知参数,都称为统计量(statistic)。由于样本是随机的,因而作为其函数的统计量也是随机变量。3.2 集中趋势的数字度量 数据有位置吗? 数据有位置吗?“位置”一般是关于数据中某变量观测值的“中心位置”或者数据分布的中心(center或center tendency)。和这种“位置”有关的统计量就称为位置统计量(location statistic)。位置统计量不一定都是描述“中心”了,比如后面要讲的k百分位数(k%分位数) 。 集中趋势 (central tendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据数值型数据:平均数?x平均数(mean)也称为均值集中趋势的最常用测度值一组数据的均衡点所在体现了数据的必然性特征易受极端值的影响有简单平均数和加权平均数之分根据总体数据计算的,称为平均数,记为?;根据样本数据计算的,称为样本平均数,记为?x平均数(mean)如果我们根据观测值的大小把它们放在跷跷板上,则跷跷板会在均值处达到衡。对于安然公司股票变化数据,均值为-0.37。我们可以想象一下,假如每个股票变化数据都一样重要,并且按照它们的数值的大小排在一个水平的木板上,则杠杆会在0处达到平衡。下面的图形象的说明了均值是观测值的重心。简单平均数(Simple mean)设一组数据为:x1 ,x2 ,… ,xn (总体数据xN) 样本平均数总体平均数加权平均数 (Weighted mean)设各组的组中值为: 相应的频数为: 样本加权平均总体加权平均加权平均数 (例题分析)某电脑公司销售量数据分组表按销售量分组组中值(Mi)频数(fi)Mi fi 140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235 4 91627201710 8 4 5 5801395264047253700331520501720 9001175合计权平均数 (例题分析)200只灯泡使用寿命频数分布表小时数灯泡数f组中值x43-48245.548-53150.553-58255.258-632160.563-682865.568-732870.573-783375.578-832680.583-882185.588-931990.593-981095.598-1036100.5103-1082105.5108-1130110.5113-1181115.5几何平均数(geometric mean) n 个变量值乘积的 n 次方根适用于对比率数据的平均主要用于计算平均增长率计算公式为5. 可看作是平均数的一种变形几何平均数 (例题分析) 【例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率。 几何平均:算术平均:平均数 (性质)均值具有以下的重要性质:一组数据只有一个样本均值,样本均值具有唯一性。均值对变量的每一个观测值都加以利用。这就意味着比起众数、中位数,它会获得更多的信息。以后我们会说明,比起中位数与众数来,从均值中更容易获得信息。每一数值相对于均值的偏离之和总是为0,均值是唯一一个具有此性质的集中趋势的度量方法。因此,我们可以将均值视作为一组数据的重心或平衡点。平均数 (性质)当数据集有极端值时,我们最好不使用均值。例如,假设5家企业的年销售额分别

文档评论(0)

2837587390 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档