- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
l数据的描述性分析
目 录
第四章 数据的描述性分析 2
第一节 集中趋势的描述 3
一、数值平均数 3
二、位置平均数 7
三、用Excel计算反映集中趋势的的描述统计量 9
第二节 离散程度的描述 10
一、离散程度的绝对指标 10
二、离散程度的相对指标 13
三、数据的标准化 13
四、总方差、组内方差和组间方差 14
五、用Excel计算反映离中趋势的的描述统计量 15
第三节 分布偏态与峰度的测度 16
一、原点矩与中心矩 16
二、分布的偏态 16
三、分布的峰度 17
四、用Excel计算反映分布趋势的描述统计量 18
五、数据分析工具—描述统计 19
英文摘要与关键词 21
习 题 22
第四章 数据的描述性分析
通过本章的学习,我们应该知道:
描述集中趋势的指标及其计算
描述离散程度的指标及其计算
分布的偏态和峰度如何计算
如何用计算机完成上述计算
通过调查获得、经过整理后展现的数据已经可以反映出被研究对象的一些状态与特征,但认知程度还比较肤浅,反映的精确度不够,为此,我们要使用各类代表性的数量特征值来准确地描述这些数据。对单变量截面数据的特征描述,主要有四个方面:集中趋势、离散程度、偏态与峰度。
第一节 集中趋势的描述
集中趋势(Central Tendency)反映的是一组数据向某一中心值靠拢的倾向,在中心值附近的数据数目较多,而远离中心值的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。根据取得这个中心值的方法不同,我们把测度集中趋势的指标分为两类:数值平均数和位置平均数。
一、数值平均数
数值平均数是同质总体内各个个体某一数量标志的具体表现在一定时间、地点、条件下所达到的一般水平,是反映现象总体综合数量特征的重要指标,又称为平均指标。
研究总体中各个个体的某个数量标志是各不相同的。如某个生产小组10名工人由于是按计件取酬的,所以他们的工资各不相同,分别是1000元、1480元、1540元、1600元、1650元、1650元、1740元、1800元、1900元、2500元。要说明这10名工人的工资的一般水平,显然不能用某一个工人的工资作代表,而应该计算他们的平均工资,用它作为代表值。
平均工资 = = 1686 (元)
这个1686元是在这组10名工人的工资基础上计算出来的,彼此之间工资上的差异在计算过程中被抽象化了,结果得到的就是这10名工人工资的一般水平,即找到了一个代表值。
数值平均数有三种形式:算术平均数、调和平均数和几何平均数。
(一)算术平均数
算术平均数(arithmetic mean)是总体中各个体的某个数量标志的总和与个体总数的比值,一般用符号表示。算术平均数是集中趋势中最主要的测度值。它的基本公式是:
由于所掌握的资料形式不同,算术平均数可以推导出两组公式:
1. 简单算术平均数
根据未经分组整理的原始数据计算算术平均数。设一组数据为,则:
(4.1)
【例4.1】 有五名学生的身高分别为1.65、1.69、1.70、1.71和1.75米,求他们的平均身高。
【解】 (米)
简单算术平均数之所以简单,就是因为各个变量值出现的次数均相同,例4.1中每个变量值出现的次数都是1。因此,只要把各项变量值简单相加再用项数去除就可求出平均数。
2. 加权算术平均数
根据分组整理的数据计算平均数。设原始数据被分成n组,各组的变量值分别为,各组变量值出现的次数分别为,则:
(4.2)
计算加权算术平均数运用的变量数列资料有两种:单项变量数列和组距变量数列。单项变量数列直接对各组变量值进行加权平均计算;组距变量数列需要先求出各组变量值的组中值,然后,对组中值进行加权平均计算。
【4.2】根据某车间200名工人加工零件的资料,计算平均每个工人的零件生产量,资料见表4.1。
表4.1 某车间职工加工零件平均数计算表
按零件数分组(个) 职工人数(人)f 人数比重 组中值x xf 40~50
50~60
60~70
70~80
80~90 20
40
80
50
10 0.10
0.20
0.40
0.25
0.05 45
55
65
75
85 900
2200
5200
3750
850 合 计 200 1.00 — 12900 【解】根据公式(4.2),得:
(个)
从以上计算过程可以看出,次数f的作用:当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量值小的一方。可见,次数对变量值在平均数中的影响起着某种
文档评论(0)