复旦大学统计学课件_数据描述性整理.pptVIP

  • 3
  • 0
  • 约8.94千字
  • 约 87页
  • 2019-04-28 发布于福建
  • 举报

复旦大学统计学课件_数据描述性整理.ppt

复旦大学统计学课件_数据描述性整理

第三章 数据的描述性整理 第一节 总量指标和相对指标 第二节 统计整理的基本理论 第三节 次数分布 第四节 统计图 第五节 统计汇总 例如:拟调查某班统计学某次考试成绩 调查总体: 该班全体学生 总体单位: 该班每一位学生 总体单位总量:该班学生总数 标志总量 : 该班学生统计学成绩总和 请对下列指标进行分类 a.手机拥有量 b.商品库存 c.市场占有率 d.人口数 e.出生人口数 f.单位产品成本 g.人口出生率 h.利税额 质量指标: 数量指标: 时期指标: 时点指标: 离散变量: 连续变量: 第二节 统计整理的基本理论 一、统计整理的意义 1.含义 统计整理,是指根据统计研究目的,将统计调查所得的原始资料进行科学的分类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化的综合资料的工作过程。 2.意义 统计整理是统计工作过程的第三阶段,是统计调查的继续,是统计分析的前提,它是从对现象的感性认识过渡到对现象理性认识的开始,是这个过程的连续点,并为这个过程提供坚实的基础,它在统计工作中起着承前启后的作用 。 二、统计整理的内容与程序 第三节 次数分布 一、次数分布的概念 在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布。 分布在各组中的个体单位数叫做次数或频数。 各组次数与总次数之比叫做比率或频率。 将各组别与次数按一定的次序排列所形成的数列称作次数分布数列,简称分布数列,又称分配数列或频数分配。 任何分布数列都必须满足两个条件: (1)各个组的频率(比率)大于或等于零; (2)各个组的频率之和等于1。 二、变量数列的类型 统计整理中,根据分组标志的不同,分布数列分为品质分布数列(按品质标志分组所编制的分布数列)和变量分布数列(按数量标志分组所编制的分布数列)。 品质分布数列 (1)品质数列是由组的名称和各组的次数两个要素构成的。 (2)品质数列的编制程序一般比较简单,其步骤是:原始数据,归类,合计,制表。 变量分布数列 任何一个变量分布数列都是由各组变量值和各组的次数两个要素构成的。 依照各组变量值的表现形式不同,变量分布数列又可以分为单项式分布数列和组距分布数列。 (一)单项式数列 三、变量数列的编制 变量数列的编制可以分为以下5个步骤: 1.将数据按大小排序整理; 2.指定初始组数和组距; 3.确定组限的位置; 4.把数据写入各组,计算出各组的频数和频率,绘制出直方图; 5.审查直方图是否反映出数据的分布规律。 指定初始组数和组距 美国学者斯特杰斯提出,在总体各单位标志值趋于正态分布的情况下,可以根据总体单位数(N)来确定分组数(n),其公式为:n=1+3.322lgN。 缺陷:当N较少时,由该式算得的组数过多;当N较多时,由该式算得的组数过少。 组数和组距之间存在着密切的关系。当全距一定时,组数和组距的关系是: 组距=全距/组数 其中,全距等于最大变量值和最小变量值之差。 确定组限的位置 做法是:仔细审查已经排序整理过的全体数据,找出其中数据密度最大的区间范围,用这个区间范围的中点(或者是靠近中点的适当数值)作为未来统计分组所分各组中某一组的组中值,再根据已经确定的组距计算出该组的上限和下限,并以此组为基础推算出其他各组。 【例2】某地区20个企业,某年产品销售额利率指标按大小顺序排列如下(%): 6.5,9.6,11.3,13.8,15.4,16.2,18.2,18.6,18.6,

文档评论(0)

1亿VIP精品文档

相关文档