- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物统计第1章-统计数据的搜集与整理
遗传因素 环境因素 总体(Population) 指研究的全部对象,是由所研究具有某种共同性质的全部个体所组成的集合体。分为有限总体(finite population)和无限总体(infinite population)。 样本(Sample) 为总体的一部分,样本内包含的个体数目称为样本含量。 从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。抽样方法有随机抽样、分类抽样等。生物统计学上要求抽样具有代表性,应是一个总体的缩影,因此要根据具体情况采用不同抽样方法。 要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。如抽签,抓阄,用随机数字表等。随机表的用法(附表1,自习) 放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。 非放回式抽样:从总体中抽出个体后,不再放回。 有限总体中的抽样:放回式的抽样可能会重复抽中某一个体。尤其是总体量不大,或抽样范围小的时候。 无限总体在同等抽样条件下,放回式抽样和非放回式抽样没有区别。 一般情况样本的含量越大越有代表性。 1.2.1 连续型数据和离散型数据 统计学的最基本工作是收集数据,数据收集得越多越有可能揭示客观现象的特性和变化规律。 数据类型: 连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。对连续型数据进行分析的方法,通常称为变量的方法。 离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。 例:表1-2列出了某农场做高粱“三尺三”提纯时所调查的100个数据,试做其频数(率)表和频数(率)图。 1、从原始数据中找出最大值和最小值,并求出极 差。R=mamx-minx (R=170-141=30) 2、决定划分的组数,分组数是由数据的多少决定的,美国统计学家斯特吉斯提出分组数公式:n=1+3.322lgN(式中N为样本数)。 3、根据极差与决定划分的组数、确定组限。(30/10=3) 4、在频数表中列出全部组限、组界及中值。 5、将原始数据表中数据,填入频数表中,计算出每组的频数和频率。 直方图:又称组织图,横轴表示组界,纵轴表示频数(频数图)或频率(频率图),两者图形完全一样。 多边形图(折线图):横轴表示各组中值,纵轴表示频数(率),连接各点得到多边形图。 累积频数图:横轴表示各组中值,纵轴表示累积频数(率),连接各点得到累积频数(率)图(向上累积与向下累积)。 根据频数(率)表或频数(率)图,可以看出数据的三个重要特征。 集中情况:平均数,中位数,众数。 变异情况:集中在平均数两侧的程度,越集中在平均数附近说明数据越整齐。 图形的形状:对称与不对称,也可能显示异常分布,出现一些不规则的情况,需要寻找原因。 同一总体中随机抽取的样本,其频数分布不完全相同,有时差距还很大。 由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有不同,因此,需要考察结果的可信度。为了回答这一问题,首先要对总体分布有所了解。后面的第二、三章的内容就是围绕总体展开的。 样本特征数:描述样本频率分布特征的数字. 1.3.1 平均数:数据集中点的度量,种类很多。 算术平均数: 通常简称平均数。 常用简单算术平均数方法,实际应用中也常用加权平均的方法来计算。 几何平均数: 处于稳定消长过程中生物群体的数量变化呈几何级数,如在细菌、藻类等培养,求平均消长率应采用几何平均数,若用算术平均数则偏高(几何平均数小于算术平均数)。 中位数:居于中间位置个体的数值。 众数:具有最高频数的组值或中值。有单众数、双众数、三众数等。 生物统计学中一般都是用平均数,中位数和众数很少使用。 自习:频数图、频数表、平均数的性质、平均数的简化计算公式。 数据的变异程度 范围(或极差)(R) R=maxx-minx 平均离差(MD):离均差绝对值的和的平均数。 样本方差(S2): 离均差平方的和(离差平方和)除以n-1。 标准差(SD)或(S): 样本方差的开平方。 非频数资料标准差的简化计算公式: 连续型数据:用中值代替,类似离散型数据计算方法(数据较大时可用编码): 一般用三阶中心矩m3 : m3 =0 ,说明曲线对称于平均数,此时平均数等于中位数也等于众数。 m3 0,说明曲线向左偏斜,称左偏或正偏,此时众数小于中位数,而中位数小于平均数。见图1-5A。 m30,说明曲线向右偏斜面,称右编或负偏,此时平均数小于中位数,而中位数小于众数,见图1-5B图。 用三阶中心距的两个缺陷: 单位为物理学单位的立方,因此不同类型数据之间不易进行比较 没有计算数据变异的性质,
文档评论(0)