第四章数据分布特征的测度(NXPowerLite)总结.doc

第四章数据分布特征的测度(NXPowerLite)总结.doc

第四章 数据分布特征的测度 将一群数据排列成频数分布是很有用的,它可以将数据分成不同的组并表示每组的观测值的个数。这样,我们对数据分布的类型和特点就有了一个大致的了解。然而这种了解也只能是停留在表面上的,为了进一步掌握数据分布的特征和规律,进行更深入的分析研究,还需要使用代表性的数量特征值来准确地描述统计数据的分布。 第一节???? 集中趋势的测度 集中趋势(Gentral tendency)是指分布的定位,它是指一组数据向某一中心值靠拢的倾向,对集中趋势进行测度也就是寻找数据一般水平的代表值或中心值。集中趋势最重要的指标有:(1)平均数;(2)中位数;(3)众数。 一、平均数 平均数是同质总体内各单位某一数量标志在一定时间、地点、条件下所达到的一般水平,是反映现象总体综合数量特征的重要指标,又称为平均指标。 社会经济现象是错综复杂的,总体中各单位都具有区别其它单位的特征。这些特征有时表现为数量标志。数量标志的数值在总体各单位之间是不相同的(即有差别的)。例如,在工业企业这个总体中,每个企业的总产值、利润总额、工人数、工资总额等是各不相同的;在企业职工这个总体中,每个工人的年龄、工龄、工资、劳动生产率也各有差别。以工资额来说,假设某机械厂第一生产小组10名工人的月奖金额分别是400元、460元、540元、600元、650元、650元、740元、800元、900元、950元。要说明这10名工人的奖金额的一般水平,显然不能用个别工人的奖金额作代表,因为它不是失之偏高,就是失之偏低,因而应该计算他们的平均奖金额,找出一个代表值。上例中的平均奖金额为: 这个669元的平均奖金额是在这组10名工人的奖金额基础上计算出来的。在计算中把它们之间的奖金额的差异(差别)抽象化了,结果得到的就是这10名工人奖金额的一般水平(代表值)。 (一)平均数的特点和作用 平均数主要有两个基本特点:第一,它是对数量标志在总体各单位之间差异的抽象化;第二,它是一个代表性的数值,说明被研究总体的一般水平。 平均数在统计中居于重要的地位。在实际工作中,甚至在日常生活中,处处都要用到平均数。在统计研究中,平均数的作用主要有三个方面:第一,利用平均数可以对不同总体的同类现象进行空间上的比较,以说明各地区、各部门、各单位生产水平的高低和工作成绩的大小;第二,利用平均数可以对比某一现象的水平在不同时间上的变化,以说明这些现象发展的趋势或规律性。第三,利用平均数可以分析现象之间的相互依存关系。 (二)算术平均数 算术平均数(Arithmetic mean)是总体各单位的的标志总量与它相对应的单位总数之比,是集中趋势的最主要测度值。它的基本公式是: 在许多社会经济现象中都存在着这样的一个关系,即个体单位的标志值之和等于总体的标志总量。因此,计算算术平均数的目的,在于计算出总体各单位标志值的一般水平(代表值)。 在已知总体标志总量和总体单位总数的情况下,可以直接利用上述公式来计算算术平均数。例如,某公司2004年8月份的工资总额为370 000元,职工人数为200人,则该公司职工的平均工资为: 利用上面公式计算平均数时,要注意公式的子项(总体标志总量)与母项(总体单位总数)在总体范围上的可比性,即两者必须是是属于同一总体的。 由于所掌握的资料不同,算术平均数又可以分为简单算术平均数和加权算术平均数。 1.简单算术平均数 根据未经分组整理的原始数据计算平均数。设一组数据为,则平均数 (读用)的计算公式为: (4.1) 例如,有五名学生的身高分别为1.65、1.69、1.70、1.71和1.75米,则他们的平均身高用简单算术平均数方法计算如下: (米) 简单算术平均数之所以简单,就是因为各个变量值出现的次数相同,如上例中每个变量值出现的次数都是1。因此,只要把各项变量值简单相加再用项数去除就求出平均数了。 2.加权算术平均数 根据分组整理的数据计算平均数。设原始数据被分成n组,各组的变量值分别为,各组变量值出现的次数分别为,则平均数的计算公式为: (4.2) 计算加权算术平均数运用的变量数列资料有两种:单项式变量数列和组距式变量数列。单项式变量数列直接对各组变量值进行加权平均计算;组距式变量数列需要先求出各组变量值的组中值,然后,对组中值进行加权平均计算。 例如,根据某车间200名职工加工零件的资料计算平均数如下(表4.1): 表4.1 某车间职工加工零件平均数计算表 按零件数分组(个) 职工人数(人)f 人数比重 组中值x xf 40~50 50~60 60~70 70~80

文档评论(0)

1亿VIP精品文档

相关文档