统计学原理_第三章数据整理和频数分布.docVIP

  • 63
  • 0
  • 约1.81万字
  • 约 72页
  • 2018-05-18 发布于江西
  • 举报

统计学原理_第三章数据整理和频数分布.doc

统计学原理_第三章数据整理和频数分布.doc

统计学原理_第三章数据整理和频数分布 青年 中年 共计7组 2+3+2 交叉分组体系 按性别分类 按职称分类 按年龄分类 男 女 高级 中级 初级 青年 中年 共计12组2×3×2 对教师的分类 男 生 本科学生组 女 生 理科学生组 男 生 专科学生组 女 生 高校学生 男 生 本科学生组 女 生 文科学生组 男 生 专科学生组 女 生 变量数列 品质数列 将总体各单位按某个标志分成若干组,列出各组的总体单位数或各组在总体中所占的比重而形成的数列 分布数列 分 类 分组标志的具体表现 各组的次数或频数 比率或频率 构成要素 异距数列 等距数列 组距数列 单项数列 单项数列 指每个组值只用一个具体的变量值表现的数列 同时 具备 变量数列的编制 变量是离散变量 变量的不同取值个数较少 编制条件: 【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。 24 合计 3 5 6 4 3 2 1 20 21 22 23 24 25 26 工人数(人) f 日产量(件)X 编制结果如下: 组距数列 指每个组的变量值用一个区间来表现的变量数列 变量数列的编制 变量是连续变量; 或:总体单位数较多,变量不同取值个数也较多的离散变量。 编制条件: 变量值变动区间的长度相等 变量值变动区间的长度不完全相等 等距数列 异距数列 相关概念 指每组两端表示各组界限的变量值,各组的最小值为下限,最大值为上限 组限 每组变量值变动区间的长度,为上下限之差 组距 每组变量取值范围的中点数值 组中值 组中值= 某地区100个百货商店 月销售额与流通费用情况 14.2 11.4 10.1 9.2 8.5 10 20 30 25 15 50以下 50~100 100~200 200~300 300以上 每百元商品销售额中支付的流通费(元) 商店数(个) 销售额(万元) 上组限U 下组限L 如:组距d=U-L =100-50=50(万元) 如:组中值x=(U+L)/2 =(100+200)/2 =150(万元) 对于离散变量,相邻组限可间断,也可重叠; 对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以上”的开口组。 组限的表示方法 开口式组距数列组中值的计算: 首组假定下限=首组上限-相邻组组距 末组假定上限=末组下限+相邻组组距 先计算开口组的假定上、下限: 因此有: 首组 组中值 末组 组中值 数据分组包括非数值型数据分组和数值型数据分组 3.2.2 非数值型数据的分组 非数值型数据的分组也称为分类。定类数据和定序数据都是对

文档评论(0)

1亿VIP精品文档

相关文档