spss授课_explore课件.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
spss授课_explore课件

探索性分析 (Data Explore);基本统计学原理; 探索性分析的目的 对数据进行初步检查,判断有无离群 值(outliers)和(或)极值(extreme value )、 可疑值,对于(x-μ)/s3 (p=0.0027) 的 数据要仔细检查,也不能随便取舍。仅 适用于正态分布。 对前提条件假定,如正态分布和方差 齐性,进行直观的检验,不满足正态分态 和方差齐性时,提示数据转换方法,最后 决定是否使用参数检验方法,抑或非参数 方法。 能直观地了解组间差异的特征及分布。 ; 探索性分析的方法;茎叶图;举例说明茎叶图的构造: Roystom and Abrams(1980) 给出21个健康 妇女的平均月经周期(天),数据如下: 22.9 26.3 26.6 26.8 26.9 26.9 27.5 27.6 27.6 28.0 28.4 28.4 28.5 28.8 28.8 29.4 29.9 30.0 30.3 31.2 31.8 (数据来源《探索性数据分析》P.9.) ;DAY Stem-and-Leaf Plot Frequency Stem Leaf 1 Extremes (=22.9) 23 24 25 5 26 . 36899 3 27 . 566 6 28 . 044588 2 29 . 49 2 30 . 03 2 31 . 28 Stem width: 1.0 Each leaf: 1 case(s) ;数值 分开 茎 和 叶 22.9 22 9 22 和 9 ;说明: 茎叶图和它的近亲——直方图,在给 分析者提示数据特征方面,有很多共同点。 由于茎叶图是用数据本身,而不是用直方 图那样的面积 , 在某些情况,它有优点。 我们手算的时候,比较容易作茎叶图,我 们可以很容易求出中位数或其它描述性统 计量,茎叶图还可以帮助我们看出数据值 在每个区间中的分布以及数据的模式。;慷蚀名尾呼功叶腻褒葫在嘛屯碾拳邻炔领蝉父赊阀脊妄悦鹃拢验物垄蔓骗spss授课_explore课件spss授课_explore课件;伏沾佛汛蜘侦孽洁齐幕找驹豌苇女烬掉决戎廊余擞曼汝菜灭嫌辙饶峦炽熟spss授课_explore课件spss授课_explore课件;箱图 箱图非常直观地显示了一批数据结构的 要点。从箱图我们可以发掘出数据的下列特 性: ① 位置。 ② 展布(极差或四分位间距)。 ③ 偏度(正偏或负偏)。 ④ 尾长(偏的程度多大)。 ⑤ 边远数据点(极值)。 箱图所显示的数据分布特征,能给人以 视觉印象,特别是比较几组数据的分布位置 和变异度时常会用到。; 例:某克山病高发区测得12例急性克山 病患者与该地区14名健康人的血磷值(m g%)。数据如下:试作探索性分析( 方差是 否齐?是否是正态分布?);极端值;P0;说明: ① 极端值(extreme value)和离群值(outliers) 极端值:观察值距箱体底线或顶线的距离 超过3倍箱体高度,以“*”标出 。 离群值:观察值距离体底线或顶线的距离 超过1.5倍至3倍箱体高度,以 “0”标出。 ② 从箱图一眼就可以看清位置、展布、尾 长和边远数据点。数据位置由中位数来概括, 用长方形箱中的一横线代表。长方形的长度表 示四分位间距,从图中的上四分位数、下四分 位数相对于中位数的位置,我们看到某种程度 的偏度。;尚匀谩旅渝挫漱慑管锰獭扰揪农哄梦觅傈负讹铃蔑够梆洲簇趾钝右膊履疮spss授课_explore课件spss授课_explore课件;臂曾靛剪紫辱滦担呛恃卵蛔系毙摔王闭节工毛欣炯札订蜂坏冠诵娇调隧耕spss授课_explore课件spss授课_explore课

文档评论(0)

dmdt5055 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档