- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
主要参考书目:
[1] 盖钧镒主编. 试验统计方法[M].北京:中国农业出版社,2000.
[2] 莫惠栋著.农业实验设计[M].上海:上海科学技术出版社,1992.
[3] 杜荣骞. 生物统计学[M].北京:高等教育出版社,2003.
[4] 李春喜,王志和,王文林. 生物统计学[M].北京:科学技术出版社,2000.
[5] 洪楠,侯军编著. SAS for windows(v8)统计分析系统教程新编[M].北京:清华大学出版社,北京交通大学出版社,2004.
[6] 阮桂海等编著.SAS统计分析使用大全[M].北京:清华大学出版社,2003.
[7] 彭昭英著. 世界统计与分析全才SAS系统应用开发指南(上、下册)[M].北京:北京希望电子出版社,2000.
[8] 卢纹岱主编. SPSS for Windows统计分析[M].北京:电子工业出版社,2000.
[9] 郝黎仁,樊元、郝哲欧等. SPSS 实用统计分析[M].北京:中国水利水电出版社,2003.
[10] Levine D M, Krehbiel T C, Berenson M L. Business statistics: a first course, 3rd edition[M], New Jersey: Pearson Education,2002
[11] 胡小平,王长发编著. SAS基础及统计实例教程[M].西安:西安地图出版社,2001.
[12] 黄燕,吴平编著. SAS统计分析及应用[M].北京:机械工业出版社,2006.
描述统计(descriptive statistics)(复习)
第一节 反映集中性的统计数
1.算术平均数(加权算术平均数)(arithmetic mean, weighted mean)
, ,
2.中位数(median) 对于按次数分布表分组的资料计算公式如下:
,式中:Lmd是中位数所在组的组下限值,i是组距,fmd是中数所在组的次数,n是样本含量,C是中数前面组的累积次数。
3.众数(mode)
第二节 反映变异性的统计数
1.极差(range)
2.方差(variance)
样本,总体
3.标准差(standard deviation)
样本,总体
4.标准误(standard error of mean)
样本
5.变异系数(coefficient of variance)
样本的标准差与平均数相比的百分率。以CV来表示:
CV=s/×100%
第三节 反映分布情况的统计数和图
1.偏斜度(skewness) 偏斜度表示资料的分布情况,当偏斜度等于零时资料的分布是对称的,当偏斜度为正值时,分布正偏,即众数位于算术平均数的左侧;当偏斜度为负值时,分布负偏,即众数位于算术平均数的右侧,
偏斜度的计算公式为:
,(数据的三阶中心矩),利用m3有两个严重的缺点:首先带有立方的单位,其次没有计算数据变异的性质,因此没有一个绝对的含义。为了解决这一问题,将它转化为一个没有任何单位的量来表示偏斜度,转化公式如下:
,用g1判断分布是否偏斜的原则与m3相同,当|g1|=2时,偏斜就已经很大了。上式中的m2就是总体方差。(二阶中心矩)
2.峭度(峰值)(kurtosis) 也是一个度量曲线形状的一个量,用g2表示,当它等于零时,可以认为数据是服从正态分布的,当它是正值时曲线过于陡峭;当它是负值时曲线过于平坦。标准正态分布的峭度等于零,峭度的计算公式如下:
,
3.四分位数(quartiles) 用来显示25%,50%,75%的百分位数。如前所述,中位数将排序后的数据分割成两部分,有50%的观察值小于它,而有50%的观察值大于它,所以可以把它叫做二分位数。四分位数将排序后的数据分割成四部分,不难理解需要我们计算的主要是第一四分位和第三四分位,计算公式如下:
,
例如:有一组数据经排序后为:
9.77 11.35 12.46 13.80 15.47 17.48 18.37 18.47 18.61 20.72 21.49 22.47 31.50 38.16
q1=3.75,q3=11.25
Q1=13.8。Q3=21.49。
4.箱图(箱须图,箱线图)(boxplots , box-whisker-plot) 是一种描述数据分布的统计图形,利用它可以从视觉的角度观察变量值的分布情况,箱图主要表示变量的第二十五百分位数、中位数、第七十五百分位数等统计量。组成箱图的含义:①矩形框是箱图的主体,上中下(或右中左)三条线分别表示变量值的第75、50、25百分位数。变量的50%的观察值落在这一区域中。②触须线是中间的纵向(或横向)直线。上截止横线是变量值本体最大值;下截止线是变量值本体最小值。本
文档评论(0)