数据分布特征的测度—使用Excel方法..docVIP

数据分布特征的测度—使用Excel方法..doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分布特征的测度—使用Excel方法.

某中学初二(一)班数据分布特征的测度 使用excel方法 集中趋势 众数(mode)—一组数据中出现次数最多的变量值。 分类数据众数 制作:用frequency函数求出语文成绩的频数—求出各个分数段的比例—各个分数段的百分比。 数值数据众数 原始数据:原始数据—众数.xls 中位数(median)—排序后处于中间位置上的值。 制作:对语文成绩进行降序排列—根据计算公式求得中位数/插入median函数求得中位数。 数值型数据中位数 要求得这60名学生语文成绩的中位数有2种方法: 方法一: 1、首先对学生的语文成绩进行降序排列。 2、由于学生人数为偶数,所以位置计算公式= 位置= = = 30.5 语文成绩中位数= = 68 方法二:插入median函数—求得语文成绩中位数。 原始数据—中位数:原始数据—中位数.xls 四分位数(quartile)—排序后处于25%和75%位置上的值。 要求得这60名学生语文成绩的中位数有2种方法: 方法一: 1、首先对学生的语文成绩进行升序排列。 2、由于学生人数为偶数,所以位置计算公式为: QL位置= = = 15.25 QU位置= = = 45.75 QL= 61+0.75×(62-61)=61.75 QU= 78+0.25×(78-78)=78 方法二:使用函数QUARTILE求出语文成绩的四分位数。 原始数据—四分位数:原始数据—四分位数.xls 平均数(mean) 加权平均数—初二(一)班语文总评成绩 总评成绩= 原始数据—平均数: 原始数据—平均数.xls 离散程度 1、异众比率(variation ratio)—除了众数以外的数。 制作:使用frequency函数求出各个分数段的频数,根据频数得到异众比率。 原始数据—异众比率:原始数据-异众比率.xlsrange)—一组数据的最大值与最小值之差。 计算公式为: R = max(xi) - min(xi) 以数学考试成绩为例:R=98-33=65 原始数据—极差: 3、平均差(mean deviation)—各变量值与其均值离差绝对值的平均数。 以数学考试成绩为例: 计算公式= ==67.77 平均差(Md )==11.5 解:由于平均差越小,平均值越有代表性,这里数学成绩的平均差为11.5,因此均值为67.77是很具有代表性的。 原始数据:原始数据—平均差.xls 方差和标准差(variance and standard deviation) 方差: 反映了各变量值与均值的平均差异。 标准差:方差的平方根,是一组数据平均值分散程度的一种度量方差: 标准差: 原始数据: 原始数据—方差和标准差.xls 离散系数(coefficient of variation)—标准差与其相应的均值之比。 原始数据:原始数据—离散系数.xls 8 数据特征的测度 集中趋势 离散程度 分布的形状 众数 中位数 四分位数 平均数 异众比率 极差 方差 离散系数 偏态 峰态 解:这里的变量为“成绩分数段”,这是个分类变量,不同的分数段就是变量值。 所调查的初二一班60人中,60-69这个分数段的人数最多,为23人,占全班人数的38.33%,因此众数为“60-69这一分数段”。 即:M=60-69这一分数段 解:这里的语文、数学和英语成绩就是变量,不同学生的分数就是变量值。通过函数mode求得语文、数学和英语三个科目的众数。 解: Vr = = 1- = 0.62 = 62% 在调查的初二(一)班中,除了60—69这个分数段以外,取得其他分数段的成绩的学生占62%,异众比率较大。因此用“60—69”这个分数段来代表整个班的语文考试状况,其代表性不是很好 解:通过公式求得方差为214.71. 求得数学成绩的均值。 求得数学成绩单个变量值与均值的差。(使用abc函数) 求得数学成绩单个变量值与均值的差的平方。(使用power函数) 最后求得方差。 总结:我们通常用样本的波动大小去估计总体的波动大小的方法,方差越小则波动越小,稳定性也越好.方差越大说明数据波动越大,越不稳定。即方差越大离散程度越大。 由此可知数学成绩波动性较大,不稳定。数学成绩的离散程度较大。 N 解:一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。标准差越高,表示实验数据越离散,也就是说越不精确 解: 结果表明:V语文 < V数学 因此得到,语文成绩的离散程度小于数学成绩的离程度。

文档评论(0)

stzs + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档