- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 数据分布特征描述 第一节 统计表与统计图 第三章 统计描述 第一节 统计表与统计图 统计表的概念:对统计调查所获得的原始资料进行整理,得到的数据,把这些数据按一定的顺序排列在表格上,就形成了统计表。广义的统计表包括统计工作各个阶段中所用的一切表格,如调查表、汇总表或整理表等。本节所讲的统计表是狭义的统计表,即将汇总结果按一定顺序排列在由横行、纵列交叉结合而成的表格中,这种表现统计资料的表格称为统计表 统计表的结构: 我国2002年国内生产总值 2、从内容上看,统计表由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分;宾词栏是统计表用来说明总体数量特征的各个统计指标。 (3)复合表:主词按两个或两个以上标志进行分组的统计表,也称复合分组表。 2、按宾词设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列等。 (三)统计表的设计 (3)标题设计 统计表的总标题,横栏、纵栏标题应简明扼要,以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。 (5)计量单位 统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。 首先建立直角坐标系,横轴代表分组变量,纵轴表示频数或频率。以各组距为宽,各组的频数或频率为高,绘制代表各组的直方块,便形成直方图。 (二)折线图 也称多边形图,是在直方图的基础上绘制的。 (三)曲线图 当变量数列的组数无限时,折线便表现为一条平滑曲线。 曲线图的绘制方法与折线图基本相同,只是在连接各组次数坐标点时应当用平滑曲线。 (四)累计曲线图 累计曲线图的绘制。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)分布图。不论是向上累计还是向下累计均以分组变量为横轴,以累计频数(频率)为纵轴。在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向上累计曲线。对于向下累计频数分布图,在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向下累计分布曲线图。 圆形图(饼图 Pie )。 环形图。环形图与饼形图类似,但又有区别。 散点图(Scatter) 第二节 分布的集中趋势 (一)平均指标含义 4、分析现象之间的依存关系。规模和利润率 位置平均数 根据标志值某一特点位置来确定的平均数。它不是对统计数列中所有各项数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的。 众数 中位数 二、位置平均数 (一)众数 (2)由组距数列确定众数 2、计算公式:比例差值法 例: 众数的确定 (组距数列) 【例】某企业某日工人的日产量资料如下: 众数特点 1、众数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,它不受分布数列的极大或极小值的影响,从而增强了众数对分布数列的代表性。 2、当分组数列没有任何一组的次数占多数,也即分布数列中没有明显的集中趋势,而是近似于均匀分布时,则该次数分配数列无众数。 3、如果与众数组相比邻的上下两组的次数相等,则众数组的组中值就是众数值;如果与众数组比邻的上一组的次数较多,而下一组的次数较少,则众数在众数组内会偏向该组下限;如果与众数组比邻的上一组的次数较少,而下一组的次数较多,则众数在众数组内会偏向该组上限。 4、缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不象数值平均数那样利用了全部数据信息。 (二)中位数 ①标志值的个数是奇数 (2)由单项数列确定中位数 例: 中位数为第40 名和41名日产量的平均值 (3)由组距数列确定中位数 计算公式(比例差值法) 例 【课练】某车间50名工人月产量的资料如下: 其它分位点 中位数是二分位点 与中位数类似的还有四分位数(quartile)、十分位数(decile)和百分位数(percentile)等。它们分别是用3个点、9个点和99个点将数据四等分、10等分和100等分后各分位点上的值。这里只介绍四分位数的计算,其他分位数与之类似。 一组数据排序后处于25%和75%位置上的值,称为四分位数,也称四分位点。 [例3.2]在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位:元),1500、750、780、1080、850、960、2000、1250
文档评论(0)