3_第三讲_统计推断概述5.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计推断概述; 了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实际中往往不可行。 无限总体:欲分析全国成年人的血压与血脂水平?直接测量?抽样? 对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。 临床研究的特殊性决定了只能采用抽样方法,通过从已知或未知的总体中随机抽取样本来推论总体特征。;统计推断以概率论为基础,根据试验或观察得到的样本数据,来研究对象总体的客观规律性,以作出合理地估计和判断.;临床推断与统计推断;1、统计推断过程;实例演示抽样过程,寻找抽样规律;400人CE成绩 85分±8分;绘制100次抽样所获取的样本均数直方图;样本均数抽样分布具有如下特点: 各样本均数未必等于总体均数; 各样本均数间存在差异; 样本均数围绕总体均数(85分),呈正态分布; 样本均数变异范围较原变量变异范围大大缩小,这100个样本均数的均数为85.1分、标准差为1.79分 在非正态分布总体中可进行类似抽样。;2、频率分布与概率分布;随着抽样次数与样本量的增加,抽样频数分布越来越趋向于正态分布。;3、中心极限定理;样本量30;4、抽样分布的描述;4、抽样分布的描述;500人CE成绩 85±8;常见统计量与抽样概率分布类型;二、偏差与抽样误差;系统误差:可以避免,固定(或规律变化)具有方向性,往往是由于混杂与偏倚造成,可以通过严格设计加以消除与控制。;抽样误差:不可避免,随机没有方向性,可以测量与控制。 测量抽样误差的指标:标准误;与标准差有关:个体变异程度大,标准误大. 与样本含量有关:样本含量增大,标准误减少。;样本均数;问题1:如何控制系统误差?;临床研究中如何控制抽样误差?;严格定义总体与抽样单位 根据研究目的,确定目标人群与框架人群 明确诊断标准 纳入标准与排除标准;严格抽样过程 严格遵守随机化原则(randomization) 确立抽样框架(Sampling frame) 选择随机抽样方法;确保足够的样本含量 设计阶段估计样本含量;三、统计推断 ----假设检验;问题的提出 ;实例分析 ;本该研究数据类型为数值变量资料 已知一般人群的总体脉搏均数为72次/??? 从山区人群抽取了25例样本,均数为74.2次/分。 研究目的:山区成年人群脉搏数(总体1)与 一般人群脉搏数(总体2)是否相等;74.2 ~=72;步骤 1:建立假设、确定检验水准 ;无效假设:检验假设、零假设/原假设,用H0表示。样本均数间差别是由抽样误差造成的。 H0通常:某两个(或多个)总体参数相等,或某两个总体参数之差等于0,或……无效,或某资料服从某一特定分布等;;备择假设:对立假设,用H1表示。 凡是不属于H0 情况的,统统纳入备择假设。 有单侧与双侧之分。 μ≠μ0 备择假设(μμ0 ,μμ0 ) μμ0 或μμ0 任一种;检验水准? :为预先设定的概率值,确定了小概率事件标准. 实际工作中一般取?=0.05 可根据不同研究目的,给予不同的设置值.;无效假设: 无效假设针对总体而不是样本。 无效假设与备择假设是相互联系、相互对立的,两者缺一不可。 假设检验均是以无效假设为出发点。;步骤 2:选定检验方法,计算统计量 ;步骤 3:确定P值,作出推断结论 ;P值的意义;步骤 3:确定P值,作出推断结论 ;步骤 1:建立假设,确定检验水准 ;步骤 2:选定t检验,计算统计量 ;步骤 3:确定P值,作出推断结论 ;假设检验的成功与否,建立在严格的设计的基础上:排除系统误差、严格随机,样本具有代表性。 如何评价上述实例分析?;P值大小与均数差值的大小不同。假设检验只能表明总体均数间的差别有无统计学意义,不能表明差异是否显著。 ;四、统计推断 ---参数估计;1、(1-?)可信区间;可信区间估计的优劣取决两个方面: 一是可信度1??,即区间包含?的理论概率大小,愈接近1愈好。 二是区间的宽度:精度,区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。;可信区间的属性1;准确度为99%:70.8 ? 77.6次/分;可信区间的属性2;样本量扩大后的可信区间: 25例扩大到50例;问题;2、95%可信区间与95%参考值范围;2)、计算公式: 可信区间用标准误 参考值范围用标准差;3)、用途 可信区间:用于估计总体参数。 参考值范围:判断观察对象的某项指标正常与否。;五、统计推断结果评价;(一)、统计推断结果的概率性 ;诊断性试验的评价四格表;统计结果的概率性:统计结果不是绝对肯定或否定,可能犯I、II型错误 真实情况 假设检验 拒绝H0 不拒绝 H0

文档评论(0)

糖糖 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档