- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 数据资料的统计描述 ??数值计算 分布的集中趋势 各数向其中心值靠拢或聚集的程度; 分布的离散程度 各数据远离其中心的趋势; 分布的偏态与峰态 数据的分布形状. 重点 分布特征值的计算方法、特点及应用。 §4.1 集中趋势的测度 集中趋势(central tendency) 一组数据向其某一中心值靠拢或聚集的倾向,反映了一组数据中心点的位置所在. 注意: 1.选择数据的集中趋势测度值时,应该考虑到数据的类型因素. 2.适用于低层次数据的集中趋势测度值可用于较高层次的数据类型, 反之则不能. 一、算术平均数 算术平均数(arithmetic mean) 也称为均值(mean), 是全部数据的算术平均。 均值是集中趋势的最主要的一类集中趋势测度值,它可以反映单个变量取值的中间位置或均衡点, 适用于数值型数据。 简单平均值(simple mean) 设原始数据为: x1, x2,…, xn , 则 例4.1 某一大学学生毕业办公室举行了一次问卷调查, 随机发放了12份问卷, 要求应届毕业研究生填写参加工作初始月薪的愿望, 得到如下表4.1所示的资料, 计算毕业生初始月薪的平均值。 解: 例 某人购买五种物品的单价和数量如下,试计算物品的平均单价。 解: (2) 若将原始数据 x1, x2,…,xn 分成 K 个组, 各组 的组中值分别用M1, M2,…,MK 表示, 各组变量的 频数分别用 f1, f2,…, fK 表示, 则均值计算如下: 例4.2 有下列资料, 试计算加权算术平均数。 1. 均值是一组数据的重心所在,是数据误差相互抵消后的必然结果; 2. 均值具有一些重要的数学性质: A. 各变量与均值的离差之和等于零, 即 均值的不足: 均值极易受到极端值的影响。 当数据组内包含有极大 或极小的数据时,对应的均值的代表性较差。 1. 简单几何平均数 n 个变量的积的 n 次方根, 即 2. 加权几何平均数 X1, X2,…, Xk为观察值, 各观察值发生的频数分别 为 f1, f2,…, fk, 则加权几何平均数为 几何平均数与算术平均数的比较 一般地说是不同的, 只有在参与计算的各比率值比较一致时, 两者之间的差异才有可能较小. 设初始值为y0, 逐年增长率为G1,G2,…, Gn, 则第 n 年的终值为 yn=y0(1+G1)(1+G2)…(1+Gn) 若从y0变化到yn共用n年,每年的增长率都相同, 例 一位投资者持有一种股票, 在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、4.9%。计算该投资者在这四年内的平均收益率. 若投资者最初资本为10000元, 则到2003年 时本利和为 y2003=10000?1.045?1.021?1.255 ?1.049 =10000 ?(1+0.08087)4=13644.57(元) 若用算术平均数计算,则平均收益率为 调和平均数: 观察值倒数的平均数的倒数。 1. 简单调和平均数 例4.5 某顾客购买了4 件商品, 每件商品的单价分 别是2元、5元、1元和4元。如果该顾客每件商 品只买了1元, 问平均每件商品花了多少元钱? 2. 加权调和平均数 设x1, x2,…, xk为非零观察值, 且 t1,t2,…,tk 为 总值, 则加权调和平均数为 一组数据中出现次数最多的变量值, 用M0表示, 也用于测定数据的集中趋势。 数据经过分组整理后, 众数的数值与相邻两组的频数分布有一定的关系: 设众数组(最大频数所在的组)的频数为 f , 众数组前一组的频数为 f -1, 众数组后一组的频数为 f +1, 则有 1. 众数是具有明显集中趋势点的数值, 一组数据分布的最高峰点所对应的数值即为众数。 2. 若数据的分布不均匀, 则用公式计算的众数的代表性较差。 3. 众数是一个位置代表值,不受极端值的影响。 将一组数据按从小到大排序后, 处于中间位置上的变量值,用 Me 表示。 中位数是一个位置代表值, 也用于测定数据的集中趋势。 2. 已分组数据的中位数 a. 确定中位数所在的组; b. 采用下面公式计算Me: 例4.8 某市商业协会根据100个会员样本, 整理出
文档评论(0)