第1章数据分布特征的描述讲解.ppt

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分布特征的描述 数据分布的特征 数据分布特征的描述 1 集中趋势的测度 2 离散程度的测度 3 偏态与峰度的测度 学习目标 1. 掌握集中趋势各测度值的计算方法; 掌握集中趋势不同测度值的特点和应用场合。 2. 掌握离散程度各测度值的计算方法; 掌握离散程度不同测度值的特点和应用场合。 3. 掌握偏态与峰度测度方法 4.用Excel、SPSS算描述统计量并进行分析 数据分布的特征和测度 集中趋势(Central tendency) 一、数值平均数 (一)算术平均数 (二)调和平均数 (三)几何平均数 (一)算术平均数(均值) (概念要点) 全部数据的算术平均,常简称为“均值”; 最常用的集中趋势的测度值; 一组数据的均衡点所在; 易受极端值的影响; 5. 用于数值型数据,不能用于定类数据和定序数据 简单算术平均 加权均值 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下: 甲组: 考试成绩(X ): 0 20 100 人数分布(F ):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1 (权数对均值的影响) 2.设分组后的数据为:X1 ,X2 ,… ,XK 相应的频数为: F1 , F2,… ,FK 加权均值的计算公式为: 权数 权数——权衡各个数据(变量值)对总体平均数的影响作用大小的数。 简单均值是加权均值的特例——各变量值的权数全部相等时。 权数的表现形式——绝对数和相对数(比重); 比重权数更直接体现权数的实质。 权数的确定——客观赋权法; 主观赋权法。 (算例——由组距数列计算) 均值的数学性质 1. 各变量值与均值的离差之和等于零 切尾均值 切尾均值——去掉数据中最大和最小的若干项数值后的均值。 意义:消除数据中极端值对均值的影响。 例:10,9.5,8.8,8.6,8.5,8.2,8,7,5。 全部数据的均值=8.1778 切尾均值=8.371 (两端各去掉一个极端值) 切尾均值=8.420(两端各去掉两个极端值) (二)调和平均数(Harmean) (概念要点) 1. 也称为“倒数平均数”,即变量值的倒数的平均数的倒数。 计算公式为: 调和平均数 (算例) 几何平均数(Geomean) (概念要点) N 个变量值乘积的 N 次方根; 计算公式: 几何平均数 (算例) 【例】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。 极端值对数值平均数代表性的影响 【例1】某个领导小组各成员的年龄分别为: 55,55,55,52,23(岁) 平均年龄=48(岁); 众数=55(岁) 例2:设在某次捐款献爱心的活动中,有两个科室的 捐款数额分别为(单位:元): 甲:80,90,100,100,100,110,120 乙:10,10,10, 10, 10, 600 甲:平均数额=100元; 众数=100元 乙:平均数额=108.33元 众数= 10元 二、位置代表值 (一)众数 (二)中位数 (三)四分位数 (一)众数(Mode) (概念要点) 集中趋势的测度值之一 出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数  计算和应用众数的前提:数据有明显的集中趋势;             总体单位数充分大。 5.主要用于定类数据,也可用于定序和数值型数据。 众数 (众数的不唯一性) 无众数(矩形分布) 原始数据: 10 5 9 12 6 8 众数的确定——定类数据中 众数的确定——定序数据中 众数的确定——数值数据 中 未分组数据——先整理为单项数列; 分组数据: 单项数列中——根据定义直接观察即得       众数的数值。 组距数列(等距数列)中—— 先找到众数所在组; 再根据相邻组次数来推算众数的近似值。 组距数列计算众数 组距数据的众数(算例) 中位数 (Median) 集中趋势的测度值之一; 排序后处于中间位置上的值; 未分组数据的中位数 (算例) 原始数据: 24 22 21 26 20 排 序: 2

文档评论(0)

文档资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档