2011生物统计学复习提纲.docVIP

下载本文档

53
0
约1.65万字
约 25页
2016-11-30 发布于重庆
举报
版权申诉

2011生物统计学复习提纲.doc

1、本文档共25页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2011生物统计学复习提纲

生物统计学复习提纲（2011）第1章统计学的基本概念总体：根据研究目的确定的同质研究对象的全体（集合），如成人的身高。样本：从总体中随机抽取的部分观察单位，我们班同学的身高。根据观察数据之间有无缝隙（gap），常将数据分类为离散型变量（如A，B，AB，O血型）与连续型变量（成人的身高）两大类。参数：总体的统计指标，如总体均数、标准差，采用希腊字母分别记为μ、σ，为固定的常数。统计量：样本的统计指标，如样本均数、标准差，采用拉丁字母分别记为，为参数附近波动的随机变量。统计描述集中趋势(central tendency): 变量值集中的位置，即平均水平指标。常用描述集中趋势的统计量有： 1. 算术均数(arithmetic mean)，简称均数 (mean) 2. 几何均数(geometric mean)，适用条件：呈倍数关系的等比资料或对数正态分布（正偏态）资料；如增长速度、抗体滴度资料 3. 中位数 (median)，反映一批观察值在位次上的平均水平。 4. 众数（mode），适用于大样本；较粗糙。 5. 调和均数（harmonic mean），反映变量不同阶段的平均增长率或平均规模。几种平均数之间的关系：算术平均数几何平均数调和平均数。离散趋势(tendency of dispersion)：变量值围绕集中位置的分布情况，即个体观察值的变异程度。常用的变异指标有： 1. 极差(Range）：也称全距。 2. 百分位数与四分位数间距Percentile and Quartile range。上述的两个指标没有考虑到每个观察值的变异。 3. 方差Variance: 也称均方差（mean square deviation），观察值的离均差平方和的均值。总体和样本的方差分别记为σ2，S2。 4. 标准差（Standard Deviation，SD或STD，简记为S）: 方差的正平方根；其单位与原变量X的单位相同。总体和样本的方差分别记为σ，S。 5. 变异系数 Coefficient of Variation：。 6. 标准误(standard error, SE): 样本均数的标准差，记为。可用于衡量抽样误差的大小。样本标准误与总体标准差σ有如下关系：，n = 样本量。增大样本含量可减小标准误，但不能减小标准差。如我们班女生平均身高160cm，SD=9cm。如果我们一次抽取4人，得到的若干个身高均值的标准差（即SE）将为4.5cm；如果我们一次抽取9人，得到的若干个身高均值的标准差（即SE）将为3cm。描述一组数值变量资料的分布特征时，对于正态分布，应选用算术平均数和标准差；对于偏态分布应选用中位数和四分位数间距数据标准化的方法是把原始观测值和均值之差除以标准差；得到的度量称为标准得分(standard score，又称为z-score)。例：假定两个水平类似的班级（一班和二班）上同一门课，但是由于两个任课老师的评分标准不同，使得两个班成绩的均值和标准差都不一样。分数的均值标准差一班 78.53 9.43 二班 70.19 7.00 那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢？张颖的标准得分为（90－78.53）/9.43=1.22 刘疏的标准得分为 (82-70.19)/7.00=1.69 第2章常见的概率分布/样本均数的抽样分布 1. 常见的概率分布 1.1 二项分布任一事件：成功（A）—— 失败（非A）这类“成功─失败型”试验称为Bernoulli试验。n次Bernoulli试验构成了Bernoulli试验序列。若一个随机变量的可能取值是= 0,1,…,，且相应的取值的概率为： P(=)= 。则称此随机变量X服从以、为参数的二项分布，记为X～B(,)。如：毒理试验中一定数量（n）白鼠死亡数（k）的分布。 1.2 泊松分布当二项分布中n很大，π很小时，二项分布就变成为Poisson分布，所以Poisson分布实际上是二项分布的极限分布。泊松分布的概率函数为： , x为单位时间或单位空间内某事件的发生数，e为自然对数的底，为大于0的常数，即服从以为参数的泊松分布，泊松分布适合于描述单位时间（或空间）内随机事件发生的次数。泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。泊松分布更多地专用于研究单位时间、单位人群、单位空间内，某罕见事件发生次数的分布，如：单位空间中某些野生动物或昆虫数的分布；每升水中大肠菌群数的分布等。 1.3 正态分布若连续型随机