描述统计学:表格法和图形法.教学提纲.pptVIP

  • 5
  • 0
  • 约4.14千字
  • 约 46页
  • 2020-04-28 发布于浙江
  • 举报

描述统计学:表格法和图形法.教学提纲.ppt

2) 组距式分组 组距式分组就是将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。 适用于:连续变量/离散变量且变量值较多 组距:等距分组适用于变量值的变动比较均匀 不等距分组适用于变动很不均匀,且变动幅度大 例:对学生成绩的分组可以分为 0~20分、20~40分、40~60分、60~80分、80~100 例:学生成绩分组也可分为 0~60(D) 60~80(C) 80~90(B) 90~100(A) 关键问题:分组数目的确定/组距的确定 表4 分组组数参考表 N 15~24 25~44 45~89 90~179 180~359 k 5 6 7 8 9 以下主要介绍等距分组的基本步骤: 第一,数据排序; 第二,分组数目的确定; 使每组所包含的数据个数,平均不少于4个或5个, 或采用斯特吉斯经验公式,即 k = 1+3.322×lgN k为组数;N为总体中的个体数。 第三,组距的确定 组距=(最大值-最小值)÷组数 第四,组限的确定 组限的选择应做到第一组的下限应略低于最小变量值,最后一组的上限应高于最大变量值。 离散型变量:相邻组的上下限可以不重叠 连续型变量:相邻两组的组限可以重叠,即上一组的上限同时也是下一组的下限。用“上限不在内”原则解决重复问题。 当变量值变动范围较大时,最小组为“……以下”,最大组为“……以上”的开口组。 第五,组中值的确定 组中值=(上限+下限 )÷2 开口组的组中值: 组中值=下限+邻组组距/2(缺上限) 组中值=上限-邻组组距/2(缺下限) 3.2.2 相对频数分布和百分数频数分布 相对频数:一个组的观测值占总数的比例。对于n个观测值, 组的相对频数=组频数/n 组的百分数频数是相对频数乘以100. 例:一家会计师事务所,对其一个包含20个客户的样本,完成年终审计所需求的时间的数据集,通过对表中的审计时间数据构建频数分布来演示步骤。 表5 年末审计时间(天数) 频数的求法:函数 countif ( range, criteria ) 12 14 19 18 15 15 18 17 20 27 22 23 22 21 33 28 14 18 16 13 表6 审计时间数据的频数分布 审计时间/天 频数 相对频数 百分数频数 10-14 4 0.20 20 15-19 8 0.40 40 20-24 5 0.25 25 25-29 2 0.10 10 30-34 1 0.05 5 总计 20 1.00 100 3.2.4 直方图 直方图是一种常用的数量型数据的图形描绘方式。由先前已汇总出的频数分布、相对频数分布或百分数频数分布等资料可构建直方图。 画法: (1)所关心的变量放置在横轴上 (2)频数、相对频数或百分数频数放置在纵轴上 (3)每组的频数、相对频数或百分数频数用一个长方形绘制,长方形的底放置在横轴上,以组距为底,以每组相应的频数、相对频数或百分数频数为高。 (4)与条形图不同,直方图相邻组的长方形之间没有自然的间隔。 直方图的一个最重要的应用是提供了关于分布形态的信息。 图5 四种不同分布的直方图 3.2.5 累积分布 累积频数分布表示的是小于或等于每一组上组限的数据项个数,是数值型数据的另一种表格汇总方式。 审计时间/天 频数 累积频数 10-14 小于或等于14 4 4 15-19 小于或等于19 8 4+8=12 20-24 小于或等于24 5 4+8+5=17 12+5=17 25-29 小于或等于29 2 4+8+5+2=19 17+2=19 30-34 小于或等于34 1 4+8+5+2+1=20 19+1=20 累积相对频数表示小于或等于每一组上组限的数据项的比例,可以对相对频数分布中的相对频数求和,也可以用累积频数除以数据总数求得。 审计时间(天) 相对频数 累积频数 累积相对频数 累积百分数频数 10-14 小于或等于14 0.20 4 4/20=0.20 20 15-19 小于或等于19 0.40 12 12/20=0.60 0.20+0.40=0.60 60 20-24 小于或等于24 0.25 17 17/20=0.85 0.60+0.25=0.85 85 25-29 小于或等于29 0.10 19 19/20=0.95 0.85+0.10=0.95 95 30-34 小于或等于34 0.05 20 20/20=1.00 0.95+0.05=1.00 1

文档评论(0)

1亿VIP精品文档

相关文档