卫生统计学第八版李晓松第三章 数据产生.ppt

卫生统计学第八版李晓松第三章 数据产生.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * 第四节 样本的可靠性与代表性 第四节 样本的可靠性与代表性 第四节 样本的可靠性与代表性 当用统计量来估计总体参数时,统计量会随着抽样结果的不同而不同,该现象可能影响我们采用统计量来估计总体参数的质量。 由抽样引起的统计量与统计量之间或者统计量与总体参数之间的变异不是无规律的,而是具有某种潜在的模式。 1. 变量的总体分布 总体中所有个体观测值的分布。 2. 统计量抽样分布 统计量的分布规律,描述了从同一总体重复抽样时,统计量会有些什么样的值,以及每个值出现的可能性大小。 (一)抽样分布 第四节 样本的可靠性与代表性 例3 某环境监测点2015年1月1日至2月28日对每小时PM10浓度值进行监测。 图 (A)采用某环境监测点监测时间内每小时的PM10浓度值,描述的是总体分布。 图 (B) 从这个总体中随机抽样(每次样本量为50),共抽取100次得到的100个样本均数的分布。 (一)抽样分布 第四节 样本的可靠性与代表性 图(B) 样本均数的抽样分布图 图(A) 所有个体测量值分布图 (总体分布) 从图知,样本均数的变异程度小于个体观测值。 重复抽样过程 从总体中进行简单随机抽样,每次抽取的样本量为n。 计算出统计量。 重复上述两步,即从同一个总体中反复多次独立地随机抽样后获得多个统计量。 展示多个统计量的分布特征。 (一)抽样分布 第四节 样本的可靠性与代表性 (一)抽样分布 第四节 样本的可靠性与代表性 重复抽样过程(统计量为样本均数) (一)抽样分布 第四节 样本的可靠性与代表性 重复抽样过程(统计量为样本率) 1. 抽样变异与抽样误差 (1)统计量的值在重复随机抽样的样本中各不相同,这种统计量随着样本的变化而变化的现象称为抽样变异(sampling variability) 。 (2)抽样误差(sampling error)表达了统计量与待估计总体参数之间不完全相等的事实,而抽样变异则形象地说明了不同样本间的统计量存在变异。 (二)抽样误差 第四节 样本的可靠性与代表性 (二)抽样误差 第四节 样本的可靠性与代表性 例1续 就器械锻炼的流行病学调查而言,假设人群中实际有60%的人抵触器械锻炼。可用计算机设计程序抽取多个简单随机样本,为每个样本计算出一个样本率p,将所有的样本率p的值绘制成直方图。 图(A):从率为0.6的总体中分别抽取1000个样本量为100的简单随机样本的样本率p的分布。 图(B):从相同的人群中抽取1000个样本量为2500的简单随机样本,并重新计算得到1000个样本率p,并绘制出直方图。 (二)抽样误差 第四节 样本的可靠性与代表性 图(B)1000次抽样的样本率(n=2500) 图(A) 1000次抽样的样本率(n=100) 比较两个直方图,可以看出增加样本量对样本率p抽样分布的影响。 (二)抽样误差 第四节 样本的可靠性与代表性 3. 标准误(standard error) (1)定义:统计量的标准差,反映了由抽样引起的统计量与总体参数之间或统计量取值之间的差异,定量刻画了抽样误差的大小。 (2)均数的标准误:样本均数的标准差,反映了均数抽样误差的大小。 (3)率的标准误:样本率的标准差,反映率抽样误差的大小。 (4)用样本均数估计总体均数时,可以借助均数标准误的大小来帮助判断估计的可靠性。 (5)常常期望降低统计量的抽样变异从而获得对总体参数更可靠的估计。 (6)来自随机样本的统计量,其变异大小不依赖于总体的大小。 (二)抽样误差 第四节 样本的可靠性与代表性 统计量的偏倚:抽样分布的均值与待估计参数的差值称为统计量的偏倚,当偏倚为零时,则称该统计量是相应参数的无偏估计。偏倚关注的是抽样分布的集中位置。 如果研究结果与真实结果之间存在方向性的偏离,那么这项研究就存在偏倚,样本不具备代表性。 (三)偏倚 第四节 样本的可靠性与代表性 偏倚和变异的箭靶示意图 第五节 伦理问题 保证所有进入研究的个体在数据收集之前均知情同意(informed consent)。 保证所有研究个体的数据保密性(confidential),仅人群水平的统计汇总报告可以公开。 所有计划实施的研究必须通过伦理审查委员会(institutional review board)的审查,避免研究对象受到可能的伤害。 基本的数据伦理 第五节 伦理问题 1. 知情同意 受试者在参与试验前需充分了解研究的性质和任何潜在风险。 2. 国际医学委员会建议使用下面的方法 (1)对在社区水平上进行的研究,需征得对此试验负责的卫生行政部门的知情同意。 (2)以医院为研究单位时,应当获得当

文档评论(0)

nuvem + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档