网站大量收购独家精品文档,联系QQ:2885784924

描述性统计分析.pptVIP

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正态性检验方法 1.直方图 2.茎叶图 3.箱线图 4.P-P图 5.Q-Q图 6 偏度、峰度检验法: 7.样本的四分位差和标准差的比值 8.Kolmogorov-Smirnov正态性检验 9.Shapiro-Wilk(W检验) 1.直方图 直方图:用矩形的宽度和高度表示频数分布的图形。 图为作业3第一次评 分结果直方图 数据分组 频数 2.茎叶图 频数 树茎 树叶 茎叶图相当于横置的直方图,但它可以保留原始数据的信息。 3.箱线图 中位数与上四分位数的距离 下四分位数与众位数间的距离 判断方法:观察矩形位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布 如何看数据是否服从正态分布呢? 4.P-P图 理论累积概率 实际值计算的累积概率 实际值计算的累积概率 差值 解读:若数据服从正态分布,P-P图样本数据点呈对角线分布。P-P趋势图应随机分布在Y=0的两侧。 5. Q-Q图 以上两种方法以Q-Q图为佳,效率较高。 观察值分位数 观察值分位数 理论分位数 观察值分位数与理论分布分位数的差值 解读:若数据服从正态分布,Q-Q图样本数据点呈对角线分布。Q-Q趋势图应随机分布在Y=0的两侧。 6 偏度、峰度检验法: g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误σg1及σg2然后作U检验。两种检验同时得出UU0.05=1.96,即p0.05的结论时,才可以认为该组资料服从正态分布 7.样本的四分位差和标准差的比值 比值= 表示四分位差,S表示标准差。若数据服从正态分布,则比值接近于1.3。 8.Kolmogorov-Smirnov正态性检验 定义:K-S检验是检查单一样本是否来自某一特定分布的方法。 检验方法:以样本数据的累积频数与特定理论分布比较,若两者间的差距较小,则推论该样本取自某特定分布族。 8.Kolmogorov-Smirnov正态性检验 定义:K-S检验是检查单一样本是否来自某一特定分布的方法。 检验方法:以样本数据的累积频数与特定理论分布比较,若两者间的差距较小,则推论该样本取自某特定分布族。 假设: 8.Kolmogorov-Smirnov正态性检验 表示样本的累积概率函数, 表示特定分布的分布函数 构建统计量 当原假设为真时,D的值应较小; 对于给定的 注:对于特定的样本量及显著性水平 可以查表得到d的值。 9.Shapiro-Wilk(W检验) W检验是建立再次序统计量的基础上,将 n个独立观测值按非降次序排列,记为 : 检验统计量为: 其中系数 在样本容量为n时有特定的值另外,系数 还具有如下性质: 9.Shapiro-Wilk(W检验) 总体分布为正态分布时,W 的值应该接近1,因此,再显著性水平 下,如果统计量W的值小于其 分位数,则拒绝原假设。 即拒绝域为 { } 其中 分位数可查表。 如若在计算中有 ,则在显著水平为 上未落入拒绝域,即可认为该批数据服从正态分布;若在计算中有 ,则在显著水平为 上落入拒绝域,认为该批数据不服从正态分布。 例子: K-S方法和S-W方法是有区别的,一般情况下,K-S方法在心理测量中经常使用,S-W方法在样本容量小于50时可以使用 判别:如果P值小于 0.05,则拒绝数据正态的原假设,即数据不是正态分布。 方差齐性检验 定义:方差齐性实际上是指要比较的两组数据的分布是否一致,通俗的来说就是两者是否适合比较 方法:常用Levene方差齐性检验,也称为Levene检验 优点:相较其他方法用途较广泛。可以对原始数据的数据转换; Levene检验既可以用于正态分布的资料,也可以用于非正态分布的资料或分布不明的资料 用处: Levene检验主要用于检验两个或两个以上样本间的方差是否齐性.要求样本为随机样本且相互独立。 方差齐性检验 基于均数 基于中位数 中位数并调整自由度 删除数据极值后均数 P值均小于0.05,因此数据方差不齐。说明两次评分结果不一致。 方差齐性检验-水平分位图 从图上可以 看出,随着中 位数的上升, 四分位数间距 呈下降趋势。 相应的斜率为 -0.551。更进 一步证明方差 不齐。 四分位数间距 中位数 谢谢观赏 * 关于异常值处理 邓勃 清华大学化学系 * * L/O/G/O 2012年3月20日 数据分析——描述统计 前言 在做数据分析的时候,一般首先要对数据进行描述性统计分析,以便于描述测量样本的各种特征及其所代表的总体的特征以及发现其数据的内在规律,再选择进一步分析的方法。 描述性统计分析

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档