第三章离散趋度量—理解变异性.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章离散趋度量—理解变异性

案例: 有两组学生成绩 甲组:50 60 70 80 90 乙组:60 65 70 75 80 第三章 离散趋势量数——理解变异性 第一节 什么是离散趋势量数 第二节 离散系数种类:异众比率、四分位差、 极差、标准差和方差、离散系数 第三节 偏态与峰态 第四节 标准化 一、定义 数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 反映社会经济现象变动的均匀性和稳定性 不同类型的数据有不同的离散程度测度值 第一节 什么是离散趋势量数 第二节 离散系数种类 异众比率 (variation ratio) 1. 对分类数据离散程度的测度 2. 非众数组的频数占总频数的比例 3. 计算公式为 异众比率 (例题分析) 四分位差 (quartile deviation) 1、对顺序数据离散程度的测度 2、也称为内距或四分间距 3、上四分位数与下四分位数之差 Qd = QU – QL 4、反映了中间50%数据的离散程度 5、不受极端值的影响 6、用于衡量中位数的代表性 极差(range) 1、一组数据的最大值与最小值之差 2、离散程度的最简单测度值,常用于数值型数据 3、易受极端值影响 4、未考虑数据的分布 许多时候,平均掩盖了数据的真实深度。 好的决策不仅要考虑集中趋势度量,还要考虑散步大小。 所有的东西只为平均水平设计,我们的社会将会崩溃(高速公路、大坝、房屋建筑、温度) “一个人在通过平均深度为1米的河流时淹死了” 平均差 (mean deviation) 1、各变量值与其平均数离差绝对值的平均数 2、能全面反映一组数据的离散程度,受极值影响 3、数学性质较差,实际中应用较少 平均差 (例题分析) 平均差 (例题分析) 思考 比较下列两组数据的极差: A组:2,10,5,5,5,5,5,5,5,5. B组:4,6,3,7,2,8,1,9,5,5. 试问:A组与B组,哪个组的数据离散程度较大? 标准差(standard deviation)和方差 标准差各变量与其平均值的差平方的平均数的平方根。 案例 思考,你认为A组和B组的标准差哪一个比较大呢? SA=18.7 SB=7.3 样本方差和标准差 未分组数据: 样本方差 自由度(degree of freedom) 1、一组数据中可以自由取值的数据的个数 2、当样本数据的个数为 n 时,若样本均值?x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值 3、例如,样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值 4、样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量 样本标准差 (例题分析) 样本标准差 (例题分析) 甲、乙两台包装机同时分装质量为400g的奶粉,从 它们各自分装的奶粉中随机抽取了10袋,测得它们 的实际质量(单位:克)如下: 甲:401 400 408 406 410 409 400 393 394 394 乙:403 404 396 399 402 401 405 397 402 399 试问:哪台包装机包装的奶粉质量比较稳定? 可用来反映社会生产和其他社会经济活动过程的均衡性或协调性,以及产品质量的稳定程度。 案例: 问该班男生是身高的变异性大还是体重变异性大? 离散系数 (coefficient of variation) 1、 标准差与其相应的均值之比 2、对数据相对离散程度的测度 3、消除了数据水平高低和计量单位的影响 4、 用于对不同组别数据离散程度的比较 5、 计算公式为 案例: 问该班男生是身高的变异性大还是体重变异性大? 离散系数 (例题分析) 离散系数 (例题分析) 数据类型与离散程度测度值 第三节 偏态和峰态及其度量 偏态与峰态分布的形状 偏态 (skewness) 统计学家Pearson于1895年首次提出 数据分布偏斜程度的测度 1. 偏态系数=0为对称分布 2. 偏态系数 0为右偏分布 3. 偏态系数 0为左偏分布 偏态系数 (skewness coefficient) 根据原始数据计算 根据分组数据计算 偏态系数 (例题分析) 偏态系数 (例题分析) 偏态与峰态 (从直方图上观察) 峰态 (kurtosis) 统计学家Pearson于1905年首次提出 数据分布扁平程度的测度 峰态系数=0扁

文档评论(0)

mg60065 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档