- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计描述图表补充--箱式图
统计描述图表补充—箱式图
箱式图箱式图 ((Boxplot ) )
箱式图箱式图 (( ))
包含多个基本统计量,以集中展现成组数据分布的形状、中心和分散特征的一类统计图。
较适合用于多组数据之间的对比,同时也是分析离群值(outliers )的有效工具(发明人 John
Tukey,1977)。
1、简单箱式图
分别以四分位数 (Q3, Q1 )为箱型方框的上、下边,以最大值 (max )、最小值 (min )
为线的上、下端,同时标出中位数 (median )的位置。如例1:
A B C
Q1 20 40 30
min 10 20 18
median 35 60 50
max 95 100 90
Q3 70 80 57
(1) (2 ) (3 )
其中 (2 )呈对称分布特点;(1)分布呈左偏;(3 )分布呈右偏。通过箱式图中数据点
的位置关系可以反映数据分布的对称性。
2 、考虑离群值的箱式图 :
分别以四分位数 (Q3, Q1 )为箱型方框的上、下边,以不超出区间[Q1-1.5*IQR ,
Q3+1.5*IQR] 的最大、最小观测值为线的上、下端,同时标出中位数 (median )的位置。当
某观测值超过了线的上下端,即视为离群值,用“☉”标出。
其中,IQR (interquartile range )= Q3-Q1
2, 57, 60, 60, 65, 68, 71, 72, 73, 76, 77, 98, 110, 150, 220
例2 :
Median = 72 ;Q1=62.5;Q3=87.5;IQR=25; 正常值区间[25,125];下端值=57 ;上端值
=110 ;2,150,220 为离群值。箱式图如下:
补充:有时箱式图的绘制(如在统计软件SPSS 中)还进一步考虑所谓极端值(extreme
cases )。其判别标准很简单,即超出区间[Q1-3*IQR ,Q3+3*IQR]范围的数值。如上例中,
极端值的判断区间为 [-12.5 ,162.5],以此为准可知220 为极端值,可以将其单独标明 (如
用符号 “*”)。
箱式图的绘制箱式图的绘制
箱式图的绘制箱式图的绘制
Excel :Excel 未设箱式图自动生成功能,可照boxplot.xls 所示逐步绘制类似于例 1 的
简单箱式图。
SPSS:用箱式图比较下列三组数据的分布特点:
A :2, 57, 60, 60, 65, 68, 71, 72, 73, 76, 77, 98, 110, 150, 220
B :34, 57, 31, 78, 129, 56, 34, 88, 70, 45
C :12, 34, 37, 78, 103, 189, 45, 67, 87, 24, 75
实现步骤:
1、 数据输入:建立2 个变量 “value ”、“组别”,前者为具体数值,后者用于指定A 、
B 、C 组属;
2 、 箱式图绘制:图形对话框交互箱图,以“组别”为横轴,“value ”为纵轴,
结果输出如下:
图中:点号代表离群值,星号代表极端值
文档评论(0)