- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数值型数据:平均数 平均数(mean) 集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 主要用于数值型数据 平均数的分类 1)、简单算术平均数 2)、加权算术平均数 3)、几何平均数 1)、简单算术平均数 定义:它是用总体或样本变量的总和除以总体或样本数据的个数所计算平均数 计算公式: 例:某车间20个工人某日产量 的平均数 数据:32 41 28 41 32 45 32 61 32 28 32 41 61 32 32 61 41 28 32 28 工人平均日产量: 2)、加权算术平均数 加权平均数(权数对均值的影响) 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组: 考试成绩(x ): 0 20 100 人数分布(f ):1 1 8 乙组: 考试成绩(x): 0 20 100 人数分布(f ):8 1 1 平均数(数学性质) 1. 各变量值与平均数的离差之和等于零 几何平均数(geometric mean) n 个变量值乘积的 n 次方根 适用于比率数据的平均 主要用于计算平均增长率 计算公式为 几何平均数 (例题分析) 【例】某水泥生产企业1999年的水泥产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%。求各年的年平均增长率。 众数、中位数和平均数的比较 众数、中位数和算术平均数 (1)众数、中位数和算术平均数的分布关系 (2)众数、中位数和算术平均数的特点 (3)众数、中位数和算术平均数的应用场合 众数、中位数和算术平均数的分布关系 从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于组数据中间位置上的值,而算术平均数则是全部数据的算术平均。 众数、中位数和算术平均数的特点 众数是一组数据分布的峰值,是位置代表值。其特点是不受极端值的影响,具有不唯一性,对于一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。 中位数是一组数据中间位置上的代表值,与中位数类似的还有四分位数,它们也都是位置代表值,其特点是不受极端值的影响。 算术平均数是就全部数据的计算,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要特点是易受数据极端值的影响, 众数、中位数和算术平均数的应用场合 从当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择算术平均数作为集中趋势的代表值,因为算术平均数包含了全部数据的信息,而且易被大多数人所理解和接受; 当数据为偏态分布,特别是当偏斜的程度较大时,我们应选择众数和中位数的位置代表值,这时它们的代表性要比算术平均数好。 此外,算术平均数只适用于定量数据,而对于定性数据则无法计算算术平均数,但可以计算众数和中位数的定性数据。而调和平均数和几何平均数则不一定适合定量数据,因为当一组数据中出现0或负数时,无法计算调和平均数或几何平均数。 离散趋势 分类数据:异众比率 异众比率(variation ratio) 1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比例 3. 计算公式为 异众比率 (例题分析) 数值型数据:方差和标准差 极差(range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 平均差(mean deviation) 各变量值与其平均数离差绝对值的平均数 能全面反映一组数据的离散程度 例 已知A、B两组学生的成绩如表所示,试分别计算其平均差。 方差和标准差(variance and standard deviation) 数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 样本方差和标准差 (simple variance and standard deviation) 未分组数据: 样本方差自由度(degree of freedom) 一组数据中可以自由取值的数据的个数 当样本数据的个数为 n 时,若样本均值?x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 例如,样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自
文档评论(0)