- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物统计学 第一章 统计数据的搜集与整理 (描述性统计:descriptive statistics) 本章纲要 本章讲述统计学基本概念,有关描述性统计的基本统计数及其计算方法,主要内容包括: 总体与样本; 数据类型及频数分布; 样本特征数及其计算; SPSS和Excel软件的有关使用 1.1 总体与样本 1.1.1 统计数据的不齐性 即原始数据的差异性,决定了在数据处理过程中使用统计学手段的必要性。统计学的作用在于从一系列看似杂乱无章的数据中发现潜在的规律,得到正确的普适性结论。这对有关生物学方面的生产和科研尤为重要,因为生物学现象受到更多内在和外在因子的影响,具有相对更高的变异性。 1.1.2 总体与样本 统计学的核心问题:通过样本推断总体 概念: 总体(population)—具有相同性质的个体所组成的集合称为总体,它是研究对象的全体。组成总体的基本单元称为个体(Individual/case)。总体可以分为无限总体(infinite population)和有限总体(finite population);生物学多数问题为前者,即无限总体。 样本(sample) —按照一定方法,从总体中抽出的若干个体构成的集合称为样本,构成样本的每个个体称为样本单位。样本内的个体数目,称为样本含量(sample size)。 1.1.3 抽样 抽样(sampling)—按照一定的方法,从总体中获得样本的过程;最基本的抽样方法为随机抽样(random sampling)—机会均等性和个体独立性的原则。 放回式抽样(sampling with replacement)与非放回式抽样(sampling without replacement) —从总体中抽出一个个体,记录后放回总体,进行再次抽样,即放回式抽样;从总体中抽出个体,不再放回,即非放回式抽样。 样本含量对统计结果的准确性至关重要,在可操作的前提下,增大样本量可以提高统计结果的准确度。总体的结果是唯一的,样本的结果是变化的,样本量越大越接近总体,结果越趋近稳定和真实。 1.2 数据类型及频数(率)分布 数据的取得包括调查(普查与抽查)和试验两种方式 1.2.1 连续型数据和离散型数据 数据是统计工作的基础,统计方法要根据数据类型进行选择确定。 连续型数据(continuous data)—与某种标准比较所得到的数据,通常为非整数,可能带有小数,如长度,时间等。相应地,对连续型数据进行分析的方法,称为变量的方法(method of variable); 离散型数据(discrete data)—记录不同个体数量的数据,因此又称计数型数据(count data);或者表征研究对象属性的数据,为数据处理的方便,也可以化为离散型数据。相应地,对离散型数据进行分析的方法,称为属性的方法(method of attribute); 数量性状与质量性状—数量性状是测量或者计数取得的。测量得到的数据即连续型数据,也称为计量资料;计数取得数据即离散型变量,也称计数资料。质量性状资料又称属性资料,只能通过观察而不能通过测量得到的数据。如颜色、血型、有无等,质量性状数量化可以方便统计分析。 1.2.2 频数(率)表和频数(率)图的编绘 离散型数据采用单项式分组法进行整理,连续型数据则采用组距式分组法进行整理,并编绘频数表和频数图。 离散型数据频数表和频数图的编绘 例题:每天调查10名新生儿的体重情况,共调查120天,统计体重超过3公斤的新生儿的人数所出现的天数(频数),得到以下数据 连续型变量频数表和频数图的编绘 例题:测量100株某高粱品种“三尺三”,得到下表所列数据,编制频数表,绘制频数图 连续性数据频数表的编制步骤 根据原始数据的最大值、最小值,求出极差(全距),极差=最大值-最小值; 确定划分的组数,根据样本容量和极差确定,不宜太多或者太少,确定原则可根据以下原则: 根据极差和组数,确定组距、组限,组距=极差/组数; 在频数表中列出全部组限、组界及中值,中值=(组上限+足下限)/2; 对原始数据进行计数,在频数表中填入频数,计算频率。 累积频数表和累积频数图的绘制 编制累积频数表并绘制相应的累积频数图 1.2.3 研究频数分布的意义 根据频数(率)分布表或者分布图,可以直观地看出数据的分布概况和变化趋势,可以观察出数据的集中情况和离散情况。 1.3 样本特征数及其计算 数据的分布具有两个明显的特征,即集中性和离散性:集中性是指数据向某一中心聚集的趋势;离散性是指离开中心分布的趋势。表征着两个基本特性的统计数,即为特征数。反映集中性的特征数为平均数,最常用算术平均数,还包括几何平均数、中位数和众数等;反映离散性的特征数为变异数,最常用标准差,此外还包括极差、方差、变异系数等。
原创力文档


文档评论(0)