- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2011生物统计学复习提纲
生物统计学复习提纲(2011)
第1章 统计学的基本概念
总体:根据研究目的确定的同质研究对象的全体(集合),如成人的身高。
样本:从总体中随机抽取的部分观察单位,我们班同学的身高。
根据观察数据之间有无缝隙(gap),常将数据分类为离散型变量(如A,B,AB,O血型)与连续型变量(成人的身高)两大类。
参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ,为固定的常数。
统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 ,为参数附近波动的随机变量。
统计描述
集中趋势(central tendency): 变量值集中的位置,即平均水平指标。常用描述集中趋势的统计量有:
1. 算术均数(arithmetic mean),简称均数 (mean)
2. 几何均数(geometric mean),适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如增长速度、抗体滴度资料
3. 中位数 (median),反映一批观察值在位次上的平均水平。
4. 众数(mode),适用于大样本;较粗糙。
5. 调和均数(harmonic mean),反映变量不同阶段的平均增长率或平均规模。
几种平均数之间的关系:
算术平均数 几何平均数 调和平均数。
离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况,即个体观察值的变异程度。常用的变异指标有:
1. 极差(Range):也称全距。
2. 百分位数与四分位数间距Percentile and Quartile range。
上述的两个指标没有考虑到每个观察值的变异。
3. 方差Variance: 也称均方差(mean square deviation),观察值的离均差平方和的均值。总体和样本的方差分别记为σ2,S2。
4. 标准差(Standard Deviation,SD或STD,简记为S): 方差的正平方根;其单位与原变量X的单位相同。总体和样本的方差分别记为σ,S。
5. 变异系数 Coefficient of Variation:。
6. 标准误(standard error, SE): 样本均数的标准差,记为。可用于衡量抽样误差的大小。样本标准误与总体标准差σ有如下关系:,n = 样本量。
增大样本含量可减小标准误,但不能减小标准差。
如我们班女生平均身高160cm,SD=9cm。如果我们一次抽取4人,得到的若干个身高均值的标准差(即SE)将为4.5cm;如果我们一次抽取9人,得到的若干个身高均值的标准差(即SE)将为3cm。
描述一组数值变量资料的分布特征时,对于正态分布,应选用算术平均数和标准差;对于偏态分布应选用中位数和四分位数间距
数据标准化的方法是把原始观测值和均值之差除以标准差;得到的度量称为标准得分(standard score,又称为z-score)。
例:假定两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。
分数的均值 标准差
一班 78.53 9.43
二班 70.19 7.00
那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢?
张颖的标准得分为 (90-78.53)/9.43=1.22
刘疏的标准得分为 (82-70.19)/7.00=1.69
第2章 常见的概率分布/样本均数的抽样分布
1. 常见的概率分布
1.1 二项分布
任一事件: 成功(A)—— 失败(非A)
这类“成功─失败型”试验称为Bernoulli试验。n次Bernoulli试验构成了Bernoulli试验序列。
若一个随机变量的可能取值是= 0,1,…,,且相应的取值的概率为:
P(=)= 。
则称此随机变量X服从以、为参数的二项分布,记为X~B(,)。
如:毒理试验中一定数量(n)白鼠死亡数(k)的分布。
1.2 泊松分布
当二项分布中n很大,π很小时,二项分布就变成为Poisson分布,所以Poisson分布实际上是二项分布的极限分布。
泊松分布的概率函数为:
,
x为单位时间或单位空间内某事件的发生数,e为自然对数的底,为大于0的常数,
即服从以为参数的泊松分布,
泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。
泊松分布更多地专用于研究单位时间、单位人群、单位空间内,某罕见事件发生次数的分布,
如:单位空间中某些野生动物或昆虫数的分布;每升水中大肠菌群数的分布等。
1.3 正态分布
若连续型随机
文档评论(0)