- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物统计学 统计数据的收集与整理
生物统计学 Biostatistics 第一章 统计数据的收集与整理 2012.2 1.1 总体与样本 总体(population) 无限总体(intinite population) 有限总体(finite population) 样本(sample) 样本含量(sample size) 从总体中获得样本的过程称为抽样(sampling) 抽样的目的,是希望通过对样本的研究,推断其总体,样本必须能够代表总体。我们需要的样本应该是一个总体的缩影。为了达到这个目的,就需要用随机抽样(random sampling)的方法获得样本。 随机数字表的使用见附表一(p251) 从一有限总体中抽样,可分为放回式抽样(sampling with replacement)和非放回式抽样(sampling without replacement)。所谓放回式抽样是指:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。这种抽样方式可能会重复抽中某一个体。非放回式抽样是指:从总体中抽出个体后,不再放回。 1.2 数据类型及频数(率)分布 与某种标准作比较所得到的数据称为连续型数据(continuous data),又称为度量数据(measurement data)。 由记录不同类别个体的数目所得到的数据,称为离散型数据(discrete data),又称为计数数据(count data)。 在判断数据的类型之后,就要进一步研究数据的变化规律。描述数据变化规律的最简单方法是将这些数据列成频数表(frequency table)或绘成频数图(frequency graph),根据频数分布进行研究。 频数(率)表和频数(率)图的编绘 编制连续型数据的频数(率)表 的方法步骤 从原始数据表中找出最大值和最小值,并求出极差。 决定划分的组数,分组数是由数据的多少决定的,在数据较少时,如50~100个数,可以分为7~10组。数据较多时,可分为15~20组。 根据极差与决定划分的组数,确定组限。 在频数表中列出全部组限、组界及中值。 将原始数据表中数据,用唱票的方式填入频数表中,计算出各组的频数和频率。 研究频数(率)分布的意义 1. 根据频数(率)分布,可以看出数据的集中情况(重心)。 平均值(average value, mean) 算术平均数(arithmetic mean)、中位数(median)和众数(mode)。 2. 从频数(率)表或频数(率)图中,可以直观地看出数据的变异情况。 3. 可以直观看出频数(率)图的变化形状。还可显示一些不规则的情况。 频数(率)分布的不恒定性 当用随机抽样方法获得样本时,由于偶然性,有时在一个样本中抽到的数值偏高,而另一个样本中数值偏低,使两个样本的频数分布出现不同。由于样本分布的不恒定性,当用样本去推断总体时,推断的结果也会有所不同。这就需要考察当用某一样本去推断总体时所得结果与真正总体之间有多大误差,结果的可信度有多高。 1.3 样本的几个特征数样本统计量 平均数(mean) 生物统计学中,使用最多的是算术平均数( )。 求和符号3个简单运算法则 算数平均数的基本特征 算术平均数的计算与样本内的每个值都有关,它的大小受每个值的影响。 若每个xi都乘以相同的数k,则平均数亦应乘以k。 若每个xi都加上相同的数A,则平均数亦应加上A。 如果 是n1个数的平均数, 是n2个数的平均数,那么全部n1 + n2个数的算术平均数是加权平均数(weighted mean): 平均数的计算方法 离散型数据频数资料: 例1.1 新生儿体重 连续型数据频数资料: 学习小组任务 1、学会使用随机数字表(p2和附表1)。 2、为什么说通过中值计算连续型数据频数资料平均数是不精确的,要怎样算才是精确的? 3、如何理解标准差的作用?标准差公式是怎么推导出来的(可参考1.3.3或课外参考资料)。 例1.2 “三尺三”株高 标准差 对于数据的变异程度,经常使用的度量方法有三种,它们是:范围(range)或称为极差,平均离差(mean deviation, MD)和标准差(Standard deviation, s or SD)或称为标准离差。其中最重要的是标准差。 学习小组任务 1、学会使用随机数字表(p2和附表1)。 2、为什么说通过中值计算连续型数据频数资料是不精确的,要怎样算才是精确的? 3、如何理解标准差的作用?标准差公式是怎么推导出来的(可参考1.3.3或课外参考资料)。 平均离差(mean deviation, MD) 除得的商称为样本方差(sample variance),用符号s2表示。 标准差(s,SD) 方差的缺点: 方差s2是离均差平方的平均数。虽然方差在实
文档评论(0)