04第4章数据的概括性度量.pptx

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第 4 章 数据的概括性度量PowerPoint作者:中国人民大学统计学院贾俊平第 4 章 数据的概括性度量4.1 集中趋势的度量 4.2离散程度的度量4.3偏态与峰态的度量学习目标1. 集中趋势各测度值的计算方法2. 集中趋势各测度值的特点及应用场合3. 离散程度各测度值的计算方法4. 离散程度各测度值的特点及应用场合偏态与峰态的测度方法用Excel计算描述统计量并进行分析4.1 集中趋势的度量4.1.1 分类数据:众数4.1.2 顺序数据:中位数和分位数4.1.3 数值型数据:平均数4.1.4 众数、中位数和平均数的比较集中趋势(central tendency)一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据水平的代表值或中心值不同类型的数据用不同的集中趋势测度值低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据分类数据:众数众数(mode)一组数据中出现次数最多的变量值适合于数据量较多时使用不受极端值的影响一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据众数(不惟一性)无众数原始数据: 10 5 9 12 6 8一个众数原始数据: 65 9 85 5多于一个众数原始数据: 2528 28 3642 42分类数据的众数 (例题分析)不同品牌饮料的频数分布 饮料品牌频数比例百分比(%) 果汁 矿泉水 绿茶 其他 碳酸饮料61011 8 150.120.200.220.160.301220221630合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值 所调查的50人中,购买碳酸饮料的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即 Mo=碳酸饮料顺序数据的众数 (例题分析)解:这里的数据为顺序数据。变量为“回答类别” 甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即 Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)百分比 (%) 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 836311510合计300100.0顺序数据:中位数和分位数50%50%Me中位数(median)排序后处于中间位置上的值不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能用于分类数据各变量值与中位数的离差绝对值之和最小,即中位数(位置和数值的确定)位置确定数值确定顺序数据的中位数 (例题分析)甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 24132225270300合计300—解:中位数的位置为 (300+1)/2=150.5 从累计频数看,中位数在“一般”这一组别中 中位数为 Me=一般数值型数据的中位数 (9个数据的算例)【例】9个家庭的人均月收入数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排 序:750 780 850 960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9?中位数 ? 1080数值型数据的中位数 (10个数据的算例)【例】:10个家庭的人均月收入数据排 序: 660 750 780 850960 1080 1250 1500 1630 2000位 置: 1 2 3 4 5 6 7 8 9 10 ?25%25%25%25%QLQMQU四分位数(quartile)排序后处于25%和75%位置上的值不受极端值的影响计算公式顺序数据的四分位数 (例题分析)甲城市家庭对住房状况评价的频数分布回答类别甲城市户数 (户)累计频数 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 24132225270300合计300—解:QL位置= (300)/4 =75 QU位置 =(3×300)/4 =225 从累计频数看, QL在“不满意”这一组别中; QU在“一般”这一组别中 四分位数为 QL = 不满意 QU = 一般数值型数据的四分位数 (9个数据的算例)【例】:9个家庭的人均月收入数据(4种方法计算)原始数据:1500 750 780 1080 850 960 2000 1250 163

文档评论(0)

wccebooks + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档