- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中位数: 计 算: 注 意: N为奇数时,适用于定序级以上数据的集中趋势描述; N为偶数时,适用于定距、定比型数据的集中趋势的描述。 平均指标:中位数(Median) 平均指标:中位数(Median) 例1:某单位职工受教育程度 例2:某公司3000名职工月收入分布 小学 初中 高中 大学 研究生 合计 人数(人) 1 2 3 9 2 17 累计人数(人) 1 3 6 15 17 17 600 800 1000 1200 1400 1600 1800 2000 人数(人) 150 320 650 950 450 305 140 35 累计人数(人) 150 770 1120 2070 2520 2825 2965 3000 平均指标:中位数(Median) 例3:某公司3000名职工月收入分布情况 工资(元) 人数(人) 累计人数(人) 400-600 600-800 800-1000 1000-1200 1200-1400 1400-1600 1600-1800 1800-2000 150 320 650 950 450 305 140 35 150 470 1120 2070 2520 2825 2965 3000 中位数的特点: (1)中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。 (2)有些离散型变量的单项式数列,当次数分布偏态时,中位数的代表性会受到影响。 (3)缺乏敏感性。 平均指标:中位数(Median) 平均指标:四分位数(Quartile) 四分位数:设数据集合中所有数据的排序结果为: 则序列中处于“25%N”位置的数据称为下四分位数 ,处于“75%N”位置的数据称为上四分位数 ,统称为四分位数。 上下四分位数描述了集中分布的区间。 (类似地有:八分位数、十分位数、百分位数等) 适用:(与中位数相同) N为奇数时,适用于定序级以上数据的描述; N为偶数时,仅适用于定距级以上数据的描述。 25%N 50%N 75%N 1 QL ME QU N 教材P71-72 平均指标 中位数、众数和算术平均数的关系 2.在左偏分布时 1.在对称分布时 3.在右偏分布时 4.在适度偏态时 众数与算术平均数的距离约为中位数与算术平均数距离的3倍 例:一组工人的月收入众数为1700元,月收入的算术平均数为2000元,则月收入的中位数近似值是多少? 平均指标 平均指标 数据类型 定类数据 定序数据 定距数据 定比数据 适 用 的 测 度 值 ※ *众数 ※ 中位数 ※ 算术平均数 ※ 算术平均数 — 四分位数 众数 调和平均数 — 众数 中位数 几何平均数 — — 四分位数 中位数 — — — 四分位数 — — — 众数 集中趋势的描述----变异指标 变异指标:描述总体频率分布的离中趋势或分散程度。 作用:反映现象变动的均匀性和稳定程度 说明平均指标的代表性程度 分析总体分布偏离正态的程度 种类: 异众比率 平均差 极差 标准差 四分位差 离散系数 比较 标志变异指标: 异众比率(Variation ratio) 异众比率:非众数组频数占总频数的比重 计 算: 适 用:适用于所有类型的数据,但主要用于定类数据离散程度的描述。 标志变异指标: 极差(Range) 极差:又称全距,总体各单位标志值中最大值与最小值之差。 计算:未分组或单变量分组数据: 组距分组数据: 适用:①适用于定序级以上数据; ②极差仅受极端变量值的影响,不一定能反映标志值离散的一般水平,通常应用于误差控制、波幅控制。 四分位差:上四分位数与下四分位数之差,描述分布在中间的50%数据的离散程度。 计 算: 适 用:①适用于定序级以上数据; ②与极差相比,其优点在于不受极端变量值影响。 标志变异指标: 四分位差(Quartile deviation) 平均差:各标志水平与其算术平均数
文档评论(0)