统计学原理第三章统计整理.pptVIP

  • 21
  • 0
  • 约7.79千字
  • 约 66页
  • 2023-06-18 发布于广东
  • 举报
* 2、异距数列:指各组组距不完全相等的组距数列。 1)适用范围:当总体的分布存在明显的偏斜状况时,变量不适合等距分组;总体单位的变量变动范围较大,若变量按一定比例关系发展变化的话可按等比间隔分组编制异距数列(P52)。例如,炼钢高炉按容积(m3)的异距分组为: 第三十页,共六十六页,2022年,8月28日 * 钢炉容积(m3) 组 距 100以下 — 100—200 100 200—400 200 400—800 400 800—1600 800 1600以上 — 组距间隔等比为2 第三十一页,共六十六页,2022年,8月28日 * 2)次数密度与频率密度 在异距数列中,由于各组组距不完全相同,因此分布在各组中的次数就不具有可比性。要使各组的次数可比,必须要消除组距不同的影响将不等组距的次数换算为标准组距次数。 标准组距的确定:选择数列中最小的组距。 次数密度:单位组距内分布的次数。公式: 次数密度=各组次数÷各组组距 频率密度:单位组距内分布的频率。公式: 第三十二页,共六十六页,2022年,8月28日 * 频率密度=各组频率÷各组组距 通过标准组距次数或次数密度将异距数列中不可比的各组次数换算成可比的各组次数,并可根据标准组距次数或次数密度来绘制次数分布直方图和次数分布折线图,用以反映总体的数量分布特征。 现以某厂工人年龄分布情况为例,将上述两种方法的换算结果列成表格,并绘制次数分布直方图和次数分布折线图,并与等距数列进行比较。 第三十三页,共六十六页,2022年,8月28日 * 某厂工人年龄分布情况表 工人按年龄分组 组距 人数 (人) 标准组距人数 次数密度 15—20 5 17 17 3.4 20—25 5 28 28 5.6 25—30 5 40 40 8 30—35 5 70 70 14 35—45 10 65 32.5 6.5 45—50 5 10 10 2 合 计 — 230 — — 标准组距为组距最小值5 第三十四页,共六十六页,2022年,8月28日 * 年龄 人数 未经处理的异距数列直方图 第三十五页,共六十六页,2022年,8月28日 * 次数密度 某厂工人年龄次数分布直方图 异距数列 标准组距人数 年龄 第三十六页,共六十六页,2022年,8月28日 * 标准组距人数 异距数列 A B C D 某厂工人年龄次数分布折线图 次数密度 年龄 B+D 与 A+C哪一个要大一些? 第三十七页,共六十六页,2022年,8月28日 * (三)组限与组中值 1、组限:组距两端的数值称为组限。 组限的确定也是统计分组中的重要问题。 确定组限的原则: ①体现组内的同质性和组间的差异性 ②“上组限不在内”原则 只要遵循“上组限不在内”的原则,无论是连续变量还是离散变量均可以采用相邻两组的上限和下限共用同一个数值做组限的方法。 第三十八页,共六十六页,2022年,8月28日 * 2、组中值:是各组变量范围的中间数值,可以根据各组的上限与下限的简单平均数来确定。 组中值=(上限+下限)÷ 2 为什么要计算组中值 原因:组距数列是按变量变动的一段区间来分组的,它掩盖了分布在各组内的各单位的实际变量值。为了反映每一组变量值的一般水平,统计上就用组中值来代表每一组变量值的一般水平。例: 第三十九页,共六十六页,2022年,8月28日 * 学生按体重(公斤)进行分组: 40以下 39.9以下 39.99以下 40—45 40—44.9 40—44.99 45—50 45—49.9 45—49.99 50—55 50—54.9 50—54.99 55—60 55—59.9 55—59.99 60—65 60—64.9 60—64.99 65以上 65以上 65以上 第四十页,共六十六页,2022年,8月28日 * 某班学生统计学成绩分布情况表 考试成绩 人数(人) 组中值 50—60 2 55 60—70

文档评论(0)

1亿VIP精品文档

相关文档