网站大量收购独家精品文档,联系QQ:2885784924

第4章数据的概括性度量重点.ppt

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 4 章 数据的概括性度量 学习目标 1. 集中趋势各测度值的计算方法 2. 集中趋势各测度值的特点及应用场合 3. 离散程度各测度值的计算方法 4. 离散程度各测度值的特点及应用场合 偏态与峰态的测度方法 用Excel计算描述统计量并进行分析 数据分布的特征 4.1 集中趋势的度量 4.1.1 众数 (mode) 定义1:样本数据集合中出现频次最高的那个样本值,称为“样本众数”,简称“众数”。(Mode,简记为Mo) 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据 分类数据的众数 (例题分析) 分组数据的众数 4.1.2 中位数 (median) 排序后处于中间位置上的值 不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 数值型数据的中位数 (10个数据的算例) 【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10 顺序数据的中位数 (例题分析) 4.1.2 四分位数 (quartile) 排序后处于25%和75%位置上的值 数值型数据的四分位数 【例】:9个家庭的人均月收入数据(4种方法计算) 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 四分位数 (位置的确定) 四分位数 (位置的确定) 方法3: 其中[ ]表示中位数的位置取整。这样计算出的四分位数的位置,要么是整数,要么在两个数之间0.5的位置上 方法4: Excel给出的四分位数位置的确定方法 如果位置不是整数,则按比例分摊位置两侧数值的差值 4.1.3 平均数 (mean) 也称为均值 集中趋势的最常用测度值 一组数据的均衡点所在 易受极端值的影响 根据总体数据计算的,称为平均数,记为?;根据样本数据计算的,称为样本平均数,记为?x 各变量值与平均数的离差之和等于零,离差平方和最小 简单平均数(未分组数据)(Simple mean) 例:房屋的构造主要由基础、墙和柱、楼地层、屋顶、楼梯、门窗6大构件组成,现对某房地产开发公司的一批商品房验收,各部件优良率如表,求平均优良率。 平均增长率 (例题分析 ) 4.1.4 众数、中位数和平均数的关系 众数、中位数、平均数的特点和应用 众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大且有明显峰值时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 适合于任何分布类型的资料,对于正态分布,理论上中位数等于均数。 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用 数据类型与集中趋势测度值 How to Lie with Statistics 《时代》杂志“编者的话”栏目,关于该杂志的新订阅者,有如下描述:“他们的平均年龄(中位数)为34 岁,家庭平均年收人为7270 美元。” 早期对“旧时代”读者的调查发现,“平均年龄(中位数)为41 岁??平均收入为9535 美元??” 很自然的问题是:为什么两次谈到年龄时都指出是中位数,而关于收入却不明确平均数的类型?也许这里使用的是均值,以便利用高收入读者群来达到吸引广告商的目的。 信息产业部副部长奚国华在北京举行的2007互联网大会上透露,目前我国农村的村村通电话普及率已经达到99.2%。 以每小时70 英里的速度疾驶在高速公路上,如果时间是早上7 点,那么你生还的机会将是晚上7 点的4 倍。 现在美国的许多房产都是为了满足统计上的平均家庭,即3.6 人的家庭,用现实的语言说是 3 或4 个人,即两个卧室的房屋。一些地区大量建设两个卧室的房子,这是由不完全信息的统计资料造成巨大浪费的实例。 对此,美国公共健康联合会(The American Pubic Health Association)指出:“当越过算术平均数去注意它所不能代表的实际家庭人口范围时,我们发现3 人或4 人的家庭仅占总体的45%,而35%是1 人或2 人,剩下的20%则多于4 人。” 运用平均指标应注意

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档