统计分析原则.pptVIP

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计分析原则

统计分析的原则 Principles of statistical analysis A distinctive function of statistics is this: it enables the scientist to make a numerical evaluation of the uncertainty of his conclusion. -- Snedecor (1950) 引言 统计分析的目的 把从样本中得到的结论推广到(同质)总体中去。Sample ? Population 利用均数、标准差;百分构成/率;图表等进行描述。不同处理组间的比较。 样本结论(统计量)能否代表总体(参数)? 统计分析的两个基本工具—估计Estimation和假设检验Hypothesis Test 统计学的一个重要思想 如何表明从样本中得出的结果是对总体的最好的估计(Estimate)? 例1:服用A药的病人63%得到缓解,而服用B药的病人只有53%。A药的疗效比B药好10%。(P=0.15) 例2:服用A药的病人56%得到完全缓解,而服用B药的病人只有36%。A药的疗效比B药好18%。(P0.01) 抽样变异Sampling Variation 样本均数的变异Variability of sample means 性质 1. 较大样本的均数的变异小于较小样本的均数的变异 2. 样本均数的变异小于观测值的变异 3. 样本均数的变异随观测值变异的增大而增大 随机样本的均数的分布— 抽样分布Sampling Distribution 从一个总体中随机地、不断地抽出样本大小相同的样本,这些样本具有如下性质: 1. 样本均数/方差的期望=总体均数/方差 2. 样本均数的均数=总体均数 样本均数的方差=总体方差/样本量 样本均数的标准差 -标准误 标准误的估计 3. 如果总体为正态分布,那么样本均数的分布也是正态分布。如果样本量足够大,那么即使总体不是正态分布,样本均数的分布也近似正态分布—中心极限定理(Central Limited Theorem)。 对抽样分布的补充说明 在实际应用中,只要样本数据呈单峰、大致对称的分布,就可以认为其均数的分布服从正态或接近于正态。 在实际应用中,只要样本量足够大,那么不管数据呈何种分布,都可以将其均数的分布当作正态分布来处理。 随机样本的均数的分布的第1条性质和第3条性质同样适用于样本的百分构成(如二项分布)。但是由于这类数据所代表的显然不是正态总体,所以只有在样本量相当大时才可以应用性质1和3。 记号Notations 理解抽样分布 计算机模拟Simulation 正态总体的抽样分布 例:假设原发性胆石症患者的血清白蛋白服从均数35g/l标准差6g/l的正态分布。现从中随机抽取样本量10、25、100的样本各100个考察它们的均数的分布。 理论上,均数的均数均应该等于35,均数的标准差应该分别等于 Simulation(续) 对数正态分布的抽样分布 例:假设原发性胆石症患者的血清胆红素服从均数3.6?mol/l标准差1.1 ?mol/l的对数正态分布。现从中随机抽取样本量10、25、100的样本各100个考察它们的均数的分布。 二项分布的抽样分布 例:假设哮喘在人群中的患病率为20%,现随机抽取样本量为10、25、100的样本各100个考察哮喘患者数的分布。 一个样本均数的标准误 Standard Error of a sample mean 例:216名原发性胆石症患者的血清白蛋白均数为34.46g/l,标准差为5.84g/l。假设服从正态分布并且此样本为一随机样本,试问如何用此样本的均数来对总体的均数进行估计呢? 两样本均数之差的标准误 Standard error of the difference between two sample means 因为两样本均数之差的方差等于两样本各自均数的方差之和,所以: 一个样本百分构成的标准误 Standard Error of a sample proportion 理论上,当np5时,二项分布的百分构成p近似地服从均数为p,标准差为 的正态分布。即样本百分构成p的标准误为: 例:观察到80名妇女中有13名患有哮喘,则哮喘的百分构成p为13/80=0.16,其标准误为: 两个样本百分构成的差的标准误 与两个样本均数的差的标准误一样,因为两个样本的百分构

文档评论(0)

juhui05 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档