- 107
- 0
- 约9.38千字
- 约 90页
- 2016-12-25 发布于广东
- 举报
§3.5箱形图 箱形图(boxplot,也称为箱线图、盒式图、盒须图),是用最小值、第一个四分位数、中位数、第三个四分位数与最大值5个统计量来描述数据分布的一种常用方法。通过盒式图可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个现象的比较。 (1)计算上四分位数Q1,中位数Me,下四分位数Q3;(2)在纵轴上设置适当的尺度,以Q1为底、Q3为顶绘制一个矩形箱体(也可以在横轴上绘制箱体);(3)在矩形箱体内用一条线代表Me;(4)延长箱体上端至最大值、延长箱体下端至最小值作横线,但是,这两条横线与Q1或Q3的距离不大于箱体长度1.5倍。 箱线图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5QD或大于Q3+1.5 QD的值(其中,QD= Q3- Q1)。 * * * * * * * 中位数的确定 未分组数据: 2 中位数位置= N+1 ???? 在组距数列中确定中位数 计算向上(下)累计次数; 确定中位数的位置 k=n/2 及其所在组; 用公式确定中位数: 2.众数(M0) 众数是指总体中出现次数最多或频率最大的变量值(数据),用 M0表示。 如果总体单位数少,或虽多但无明显集中趋势,就不存在众数。 从分布曲线的角度看,众数就是一个变量分布曲线的最高峰所
原创力文档

文档评论(0)