第四章 统计学.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.2 离散程度的度量 为什么要研究离散(离中)趋势??? 平均数误导投资决策 两家公司平均每个客户带来的盈利均为每天2 000元,其中甲公司每个顾客都是2 000元,乙公司一半的顾客平均为-1 000元,另一半的平均为5 000元,两者的加权平均数都为2 000。平均数给人的感觉是:两个公司一样好,所以购买哪家公司的股票都没有差别。 悲催的游泳者 一名泳客身高1.5米,問泳池水有多深,救生員告知水深平均一米,泳客落水沒頂,差点一命嗚呼;原來泳池一邊深2米,另一邊深0.5米,平均深度一米沒錯,但平均數不顯示水深變化。這是著名的「平均數陷阱」。 一、极 差 例:计算全距: 甲组80 80 80 80 80的全距=80-80=0 乙组70 75 80 85 90的全距=90-70=20 丙组2 18 25 96 259的全距=259-2=257 则:因为020257 所以:甲组的平均数的代表性要比乙组和丙组的平均数的代表性大;甲组内部的稳定性要比乙组和丙组内部的稳定性要好。 极差 小结 1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 平均差的计算公式 未分组资料: ungrouped 分组资料: grouped 二、方差和总标准差 总体标准差(计算过程及结果) 总体方差的简化计算公式 分组数据 样本方差和标准差 未分组数据: 小结: 方差和标准差 1. 离散程度的测度值之一 2. 最常用的测度值 3. 反映了数据的分布 4. 反映了各变量值与均值的平均差异 5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 相对位置的度量:标准分数 标准分数 (standard score) 1. 也称标准化值 2. 对某一个值在一组数据中相对位置的度量 3. 可用于判断一组数据是否有离群点(outlier) 4. 用于对变量的标准化处理 5. 计算公式为 标准分数 (性质) z分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数分布的形状,而只是使该组数据均值为0,标准差为1 标准分数 (例题分析) 经验法则 ?经验法则表明:当一组数据对称分布时 约有68%的数据在平均数加减1个标准差的范围之内 约有95%的数据在平均数加减2个标准差的范围之内 约有99%的数据在平均数加减3个标准差的范围之内 1、极差系数 2、 标准差系数(离散系数) 1.标准差与其相应的均值之比 2.消除了数据水平高低和计量单位的影响 3.测度了数据的相对离散程度 4.用于对不同组别数据离散程度的比较 计算公式为 标准差系数 某地7岁男童身高均数为123.10cm ,标准差为4.17cm;体重的均数为22.29kg,标准差为2.26kg。 问:是身高的差异大还是体重的差异大 男童的身高与体重 身高Vσ=4.17/123.10=0.0383    体重V σ =2.26/22.29=0.1014 标准差系数 (实例) 标准差系数 案例:标志变异指标度量风险 各种投资工具报酬率比较,问谁的离散程度最小 一组数据离散系数为0.4,平均数为20,则标准差为( ) A.80 B. 0.02 C. 4 D.8 离散系数的主要用途是( ) A. 反映一组数据的离散程度 B. 反映一组数据的平均水平 C. 比较多组数据的离散程度 D. 比较多组数据的平均水平 几种离散测度的比较 偏态与峰度分布的形状 偏态(概念要点) 1. 数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 4. 偏态系数 0为左偏分布 5. 计算公式为(组距式分组时 为组中值) 偏度值α3 一般在-3 ~ 3之间。 3为极度左偏斜 -3为极度右偏斜 绝大多数变量分布偏斜程度在-1~ 1之间 偏态(实例) 偏态与峰度(从直方图上观察) 偏态系数(计算过程) 偏态系数(计算结果) 峰度(概念要点) 1. 数据分布扁平程度的测度 2. 峰度系数=3为扁平程度适中 3. 峰度系数3为扁平分布 4. 峰度系数3为尖峰分布 5. 计算公式为 峰度系数(实例计算结果) 方差的数学性质   各变量值对均值的方差小于对任意数的方差   证明:根据均值的性质,各变量值与均值的离差平方和 为最小,即对不等于 的任意数         ,必有 则 从而当 C ≠ 0,即   时,则 只有当 C = 0,即   时,才有         根据公式 (*)

文档评论(0)

676200 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档