数据处理和统计方法硕士研究生课程.doc

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
主要参考书目: [1] 盖钧镒主编. 试验统计方法[M].北京:中国农业出版社,2000. [2] 莫惠栋著.农业实验设计[M].上海:上海科学技术出版社,1992. [3] 杜荣骞. 生物统计学[M].北京:高等教育出版社,2003. [4] 李春喜,王志和,王文林. 生物统计学[M].北京:科学技术出版社,2000. [5] 洪楠,侯军编著. SAS for windows(v8)统计分析系统教程新编[M].北京:清华大学出版社,北京交通大学出版社,2004. [6] 阮桂海等编著.SAS统计分析使用大全[M].北京:清华大学出版社,2003. [7] 彭昭英著. 世界统计与分析全才SAS系统应用开发指南(上、下册)[M].北京:北京希望电子出版社,2000. [8] 卢纹岱主编. SPSS for Windows统计分析[M].北京:电子工业出版社,2000. [9] 郝黎仁,樊元、郝哲欧等. SPSS 实用统计分析[M].北京:中国水利水电出版社,2003. [10] Levine D M, Krehbiel T C, Berenson M L. Business statistics: a first course, 3rd edition[M], New Jersey: Pearson Education,2002 [11] 胡小平,王长发编著. SAS基础及统计实例教程[M].西安:西安地图出版社,2001. [12] 黄燕,吴平编著. SAS统计分析及应用[M].北京:机械工业出版社,2006. 描述统计(descriptive statistics)(复习) 第一节 反映集中性的统计数 1.算术平均数(加权算术平均数)(arithmetic mean, weighted mean) , , 2.中位数(median) 对于按次数分布表分组的资料计算公式如下: ,式中:Lmd是中位数所在组的组下限值,i是组距,fmd是中数所在组的次数,n是样本含量,C是中数前面组的累积次数。 3.众数(mode) 第二节 反映变异性的统计数 1.极差(range) 2.方差(variance) 样本,总体 3.标准差(standard deviation) 样本,总体 4.标准误(standard error of mean) 样本 5.变异系数(coefficient of variance) 样本的标准差与平均数相比的百分率。以CV来表示: CV=s/×100% 第三节 反映分布情况的统计数和图 1.偏斜度(skewness) 偏斜度表示资料的分布情况,当偏斜度等于零时资料的分布是对称的,当偏斜度为正值时,分布正偏,即众数位于算术平均数的左侧;当偏斜度为负值时,分布负偏,即众数位于算术平均数的右侧, 偏斜度的计算公式为: ,(数据的三阶中心矩),利用m3有两个严重的缺点:首先带有立方的单位,其次没有计算数据变异的性质,因此没有一个绝对的含义。为了解决这一问题,将它转化为一个没有任何单位的量来表示偏斜度,转化公式如下: ,用g1判断分布是否偏斜的原则与m3相同,当|g1|=2时,偏斜就已经很大了。上式中的m2就是总体方差。(二阶中心矩) 2.峭度(峰值)(kurtosis) 也是一个度量曲线形状的一个量,用g2表示,当它等于零时,可以认为数据是服从正态分布的,当它是正值时曲线过于陡峭;当它是负值时曲线过于平坦。标准正态分布的峭度等于零,峭度的计算公式如下: , 3.四分位数(quartiles) 用来显示25%,50%,75%的百分位数。如前所述,中位数将排序后的数据分割成两部分,有50%的观察值小于它,而有50%的观察值大于它,所以可以把它叫做二分位数。四分位数将排序后的数据分割成四部分,不难理解需要我们计算的主要是第一四分位和第三四分位,计算公式如下: , 例如:有一组数据经排序后为: 9.77 11.35 12.46 13.80 15.47 17.48 18.37 18.47 18.61 20.72 21.49 22.47 31.50 38.16 q1=3.75,q3=11.25 Q1=13.8。Q3=21.49。 4.箱图(箱须图,箱线图)(boxplots , box-whisker-plot) 是一种描述数据分布的统计图形,利用它可以从视觉的角度观察变量值的分布情况,箱图主要表示变量的第二十五百分位数、中位数、第七十五百分位数等统计量。组成箱图的含义:①矩形框是箱图的主体,上中下(或右中左)三条线分别表示变量值的第75、50、25百分位数。变量的50%的观察值落在这一区域中。②触须线是中间的纵向(或横向)直线。上截止横线是变量值本体最大值;下截止线是变量值本体最小值。本

文档评论(0)

追风少年 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档