第三章描述统计.pptVIP

下载本文档

90
0
约1.01万字
约 75页
2018-01-11 发布于天津
举报
版权申诉

第三章描述统计.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第三章描述统计.ppt

STAT [例]设有甲、乙两班同考一门课，甲班用百分制计分，乙班用五分制计分，资料如下。试根据该资料计算有关指标以说明哪个班学生的成绩更整齐。第三章描述统计 STAT [例]已知下列资料，试比较哪组数据更集中（整齐）。第三章描述统计 STAT 例、两种不同水稻品种分别在五块田块上试种，其产量如下：假定生产条件相同，试计算这两个品种的收获率，确定哪一品种具有较大的稳定性和推广价值。第三章描述统计 STAT 续上例第三章描述统计第四节　形状指标　　　一、偏度系数二、峰度系数第三章描述统计 STAT 第五节　相对位置测度及异常值的检测　　　平均数是使用最广泛的位置测度方法，而标准差和方差则是使用最广泛的变异程度测度方法。通过平均数和标准差，还可以对数据的相对位置进行测度。一、Z分数通过平均数和标准差，可以计算一组数据中各个数据的标准化数值，从而确定其相对位置。 z分数通常被称为标准化数值。z可以解释为观察值偏离平均数的标准差个数, 其计算公式为：第三章描述统计 STAT 假定全部考生的分科总平均分和标准差及个人各科成绩如下：第三章描述统计 STAT 　z分数为正值时，表明该数据比平均数高；z分数为负值时，表明该数据比平均数低；若z分数等于零则表示相应的数据等于平均值。第三章描述统计 STAT 二、切贝谢夫定理在任何数据集中，出现在算术平均数左右K倍?范围之内的数据比例至少为（1–1/K2）。切贝谢夫定理可以得出在偏离平均数某一指定倍数范围内的数据所占的百分比。当k=2，3，4个标准差时，切贝谢夫定理有如下一些推论：　至少75％的数据落在平均数加减2倍标准差范围内。至少89％的数据落在平均数加减3倍标准差范围内。至少94％的数据落在平均数加减4倍标准差范围内。 [例]有一组顾客购物付款时等候时间的资料，已知等候时间的均值为4分钟，标准差为0.9分钟，则特点：具有普遍性但比较保守。至少为0 至少为75 至少为89 第三章描述统计 STAT 三、经验法则切贝谢夫定理的优点之一就是它适用于任何一组数据而不论其数据分布形状如何。但在实际运用中，我们发现许多现象的分布都是呈对称分布的。如果一组数据被确认接近于对称分布，就可以利用经验法则来确定在偏离平均数的某一指定倍数的范围内数据所占的百分比。经验法则：对于呈对称分布的数据来说大约68％的数据落在平均数加减1倍标准差的范围内。大约95％的数据落在平均数加减2倍标准差的范围内。大约99％的数据落在平均数加减3倍标准差的范围内。一般来说，一组数据中低于或高于均值3倍标准差之外的数据是很少的，即在均值加减3个标准差的范围内几乎包含了全部数据。第三章描述统计 STAT （2）经验法则：当资料分布呈对称时，则有 -3 -2 -1 1 2 3 正态分布第三章描述统计 STAT 第三章描述统计 STAT 四、异常值检测判定标准：利用标准化数值（Z分数）识别异常值。　　　　　　　之外值作为异常值。 * * * 分位数 1百分位数 2四分位数第三章描述统计 STAT 5 众数众数是指总体中出现次数最多的变量值，用“”表示。一般只有在总体单位比较多，且存在明显集中趋势的数列中才存在众数。众数不受极端值影响。在出现最高次数为2或大于2的情况下，可以有多个众数。如果数据有两个众数，数据是双峰的；如果数据有多于两个的众数，数据是多峰的。在多峰的情况下，众数通常不必指出。第三章描述统计 STAT 由于所掌握的资料不同，确定众数的方法可分为两种：（一）由单项数列确定众数在单项数列中，出现次数最多的变量值就是众数。（二）由组距数列确定众数在组距数列的条件下，确定众数时应首先将出现次数最多的一组定为众数组，然后再利用插补法确定众数的近似值。众数在众数组的位置直接受相邻两组次数大小的影响。众数的数值始终偏向相邻组中次数较大的组。当相邻两组的次数相等时，众数则是众数组的组中值。计算众数的下限公式为：第三章描述统计 STAT 式中：M0代表众数；L代表众数组的下限；i代表众数组的组距；代表众数组的次数与其下限的邻组次数之差；代表众数组的次数与其上限的邻组次数之差。计算众数的上限公式为：式中：U代表众数组的上限。以表2—9资