2-截面数据分析课件.ppt

  1. 1、本文档共111页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2-截面数据分析课件.ppt

指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。 众数(mode) 日产量(件) 工人人数(人) 10 11 12 13 14 70 100 380 150 100 合计 800 【例A】已知某企业某日工人的日产量资料如下: 众数的确定 (单值数列) 计算该企业该日全部工人日产量的众数。 M0 众数所在位置 众数的确定 (组距数列) 【例B】某车间50名工人月产量的资料如下: 月产量(件) 工人人数(人) 向上累计次数 (人) 200以下 200~400 400~600 600以上 3 7 32 8 3 10 42 50 合计 50 — 计算该车间工人月产量的众数。 概约众数:众数所在组的组中值,在本例为500件 众数的原理及应用 83名女生身高原始数据 83名女生身高组距数列 当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数; 当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)。 众数的原理及应用 六、分位数 分位数是将一组按大小顺序排列的数据平均分成N份的N-1个分点上的值,中位数是分位数的一个特例。 1、四分位数(Quartile) 四分位数是将一组按大小顺序排列的数据平均分成4个部分的三个分点上的数值,一般称为“1/4分位数”、“2/4分位数”、“3/4分位数”,分别记为Q1、Q2、Q3。 下四分位数 上四分位数 Q1 Q3 Q2 25% 25% 25% 25% 一般地还称上四分位数为75百分位数(75 pecentile,有75%的观测值小于它),下四分位数为25百分位数(有25%的观测值小于它)。 四分位数的计算也分为两种情况。未分组资料和分组资料。 (1)未分组资料 对于未分组资料,首先将数据按大小顺序排列,然后计算分位数所在的位置,具体计算公式为: 若以上计算结果是整数,则各个位置的数值就是相应的三个四分位数;若以上计算结果是小数,则有关的四分位数就应该采用插值的方法来确定。例如,对于已经排好序的60个数据x1,x2,…x60计算四分位数,根据上述公式确定的三个四分位数的位置分别为: (2)分组资料。 a、对于单项式变量数列,首先根据公式确定四分位数所在的位置,计算公式为: 然后计算累计频数,四分位数的位置在哪一个累计频数组内,则该组的变量值就是四分位数。 b、对于组距式变量数列。首先根据公式确定四分位数所在的位置,计算公式与单项式数列情况下的相同;然后假定在三个四分位数算子组内各个单位的变量值是均匀分布的,利用下面的插值公式计算四分位数的近似值 给出的是四分位数的下限公式,同理也有上限公式,在此从略。 2.十分位数(Decile) 十分位数是将一组按大小顺序排列的数据平均分成10个部分的九个分点上的数值,一般称为“1/10分位数”、“2/10分位数”、…“9/10分位数”,分别记为D1、D2、…、D9。十分位数的确定方法与四分位数的确定方法相同,在此不再重复。 从中位数与四分位数的计算过程,我们可以写出各种分位数的计算公式。 一般地,k百分位数(k-pecentile)意味着有k%的观测值小于它。 如果令a=k%,则k百分位数也称为a分位数(a-quantile)。 切尾平均(trimmed mean) 切尾平均是去掉大小两端的若干数值后计算中间数据的均值。 EXCEL 均值 中位数 众数 数据1,2,3,4的四分位数。 二、数据分布的离中趋势的度量 一、离中趋势的涵义 二、标志变异指标的种类及计算 三、是非标志的标准差及方差 指总体中各单位标志值背离分布中心的规模或程度,用标志变异指标来反映。 离中趋势 反映统计数据差异程度的综合指标,也称为标志变动度 变异指标值越大,平均指标的代表性越小;反之,平均指标的代表性越大。 集中趋势弱、离中趋势强 集中趋势强、离中趋势弱 测度离中趋势的意义 用来衡量和比较平均数代表性的大小; 用来反映社会经济活动过程的均衡性和节奏性; 用来测度变量数列次数分布较正态分布的偏离程度。 测度标志变异度的绝对量指标(与原变量值名数相同) 测度标志变异度的相对量指标(表现为无名数) 全距 平均差 标准差 全距 系数 平均差 系数 标准差 系数 标志变异指标的种类 四分位差 指所研究的数据中,最大值与最小值之差,又称极差(Range) 。 全距 最大变量值或最高组上限或开口组假定上限 最小变量值或最低组下限或开口组假定下限 【例A】某售货小组5人某天的销售额分别为440元、480元、520元、600元、750元,则 【

文档评论(0)

liuxiaoyu98 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档