- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 统计数据的特征描述 3.1 集中趋势的描述 描述集中趋势的几个统计量及相互关系 3.2 离散程度的描述 描述离散程度的几个统计量 3.3 分布形态的描述 描述分布形态的几个统计量 §3.1 集中趋势的描述 集中趋势 (central tendency) 是指一组数据向某一中 心值靠拢或集中的程度 用途:是为了表示社会经济现象总体各单位某一 标志在一定时间、地点和条件下达到的一般 水平,经常被作为评价事物和决策的数量标 准或参考。 主要测度值:平均数、众数、中位数、分位数 §3.2 离散程度的描述 数据的离散程度反映各变量值远离其集中趋势测度值的程度。数据的离散程度越大,集中趋势测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。 相关应用:投资的风险度 常用指标:1 极差和四分位差 2 方差和标准差 3 变异系数和异众比率 §3.3 分布形态的描述 数据分布的形态主要指数据分布的形状 是否对称,偏斜的程度以及分布的扁平程度 等。 刻画数据分布形态的测度值主要有偏度 和峰度。 Ch3 小结 §3.1 集中趋势的描述 平均数/众数/中位数/分位数 各测定指标之间的关系 §3.2 离散程度的描述 极差和四分位差/方差和标准差 变异系数和异众比率 §3.3 分布形态的描述 偏度/峰度 计算公式: fm:众数所在组的频数 fi:各分组的频数 3.3.1 偏度 偏度(skewness)是一组数据分布的偏斜方向和程度。 计算公式: Sk=0 Sk0 Sk0 对称分布 右偏分布 左偏分布 (1) 分布对称时,偏度值等于零。 (2) 分布右(正)偏时,Sk0 。且Sk值越大,偏斜 的程度就越大 (3) 分布左(负)偏时,Sk0 。且Sk值越小,偏斜 的程度就越大 3.3.2 峰度 峰度(kurtosis)是指一组数据分布的陡缓程度,它是 与标准正态分布相比较而言的。其计算公式为 正态分布 尖峰态分布 平峰态分布 normal leptokurtic platykurtic (1) 当数据分布与标准正态分布的陡缓程度相同 时,则峰度值等于零。 (2) 当数据分布的形状比标准正态分布更尖时,则 峰度值Ku0,称为尖峰态分布。尖峰分布表明集 中趋势显著,离散程度低。 (3) 当数据分布的形状比标准正态分布更平时,则 峰度值Ku0,称为平峰态分布。平峰分布表明集 中趋势不显著,离散程度大。 * * /z/93.html 3.1.1 平均数 平均数就是全部数据的算术平均,常用 来表示。是数据集中趋势的最主要测度值。 适用:数值型数据(不适用于分类数据和顺序数据) 常用形式: 简单 平均数 加权 平均数 1.算术平均数(mean) 1) 简单算术平均数 简单算术平均数就是全部数据的算术平均数。 适用:未经分组整理的原始数据资料。 计算公式:直接将各个数据相加,再除以数据个数。其计算公式为 式中, 是一组样本数据的观测值,n为样本容量。 【例3.1】 某班级20名学生的期末数学成绩是67、78、49、56、98、87、62、100、73、45、70、44、96、80、49、61、60、88、93、60(分),求该班学生的数学成绩的平均数。 解:由公式(3.1) 该班学生的数学平均成绩是70.8分。 2) 加权算术平均数 加权算术平均数:是通过各组标志值与各组频数相乘的总和除以各组频数之和得到的。 适用:已经分组整理并编制出频数分布的数据资料。 计算公式为 式中, 是单项式分组形式下第i组的变量值或组距式分组形式下第i组的组中值; 是第i组的频数;n为组数。 =0.027+0.298+1.236+0.848+0.610+0.468=3.487 即职工的平均家庭人口数是3.487人 例3.3 (已整理的组距式分组数据平均数算例) 根据第2章中的表2-7中的数据资料计算某单位某种 产品平均销售量的近似值。(见课本P43) 2.调和平均
文档评论(0)