3_第三讲_统计推断概述5.ppt

下载文档 降价啦

4
0
约2.12千字
约 68页
2016-07-20 发布于湖北
举报
版权申诉
保障服务

3_第三讲_统计推断概述5.ppt

1、本文档共68页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

统计推断概述; 了解总体特征的最好方法是对总体的每一个体进行观察、试验，但这在医学研究实际中往往不可行。无限总体：欲分析全国成年人的血压与血脂水平？直接测量？抽样？对有限总体限于人力、财力、物力、时间或个体过多等原因，不可能也没必要对所有个体逐一研究。临床研究的特殊性决定了只能采用抽样方法，通过从已知或未知的总体中随机抽取样本来推论总体特征。;统计推断以概率论为基础,根据试验或观察得到的样本数据,来研究对象总体的客观规律性，以作出合理地估计和判断.;临床推断与统计推断;1、统计推断过程;实例演示抽样过程，寻找抽样规律;400人CE成绩 85分±8分;绘制100次抽样所获取的样本均数直方图;样本均数抽样分布具有如下特点：各样本均数未必等于总体均数；各样本均数间存在差异；样本均数围绕总体均数(85分)，呈正态分布；样本均数变异范围较原变量变异范围大大缩小，这100个样本均数的均数为85.1分、标准差为1.79分在非正态分布总体中可进行类似抽样。;2、频率分布与概率分布;随着抽样次数与样本量的增加，抽样频数分布越来越趋向于正态分布。;3、中心极限定理;样本量30;4、抽样分布的描述;4、抽样分布的描述;500人CE成绩 85±8;常见统计量与抽样概率分布类型;二、偏差与抽样误差;系统误差：可以避免，固定（或规律变化）具有方向性，往往是由于混杂与偏倚造成，可以通过严格设计加以消除与控制。;抽样误差：不可避免，随机没有方向性，可以测量与控制。测量抽样误差的指标:标准误;与标准差有关:个体变异程度大,标准误大. 与样本含量有关:样本含量增大,标准误减少。;样本均数;问题1：如何控制系统误差?;临床研究中如何控制抽样误差？;严格定义总体与抽样单位根据研究目的，确定目标人群与框架人群明确诊断标准纳入标准与排除标准;严格抽样过程严格遵守随机化原则(randomization) 确立抽样框架(Sampling frame) 选择随机抽样方法;确保足够的样本含量设计阶段估计样本含量;三、统计推断----假设检验;问题的提出 ;实例分析 ;本该研究数据类型为数值变量资料已知一般人群的总体脉搏均数为72次/??? 从山区人群抽取了25例样本,均数为74.2次／分。研究目的：山区成年人群脉搏数(总体1)与一般人群脉搏数(总体2)是否相等;74.2 ~=72;步骤 1：建立假设、确定检验水准 ;无效假设：检验假设、零假设/原假设，用H0表示。样本均数间差别是由抽样误差造成的。 H0通常：某两个(或多个)总体参数相等，或某两个总体参数之差等于0，或……无效，或某资料服从某一特定分布等；;备择假设：对立假设,用H1表示。凡是不属于H0 情况的，统统纳入备择假设。有单侧与双侧之分。 μ≠μ0 备择假设（μμ0 ，μμ0 ） μμ0 或μμ0 任一种;检验水准? ：为预先设定的概率值，确定了小概率事件标准．实际工作中一般取?＝0.05 可根据不同研究目的,给予不同的设置值.;无效假设：无效假设针对总体而不是样本。无效假设与备择假设是相互联系、相互对立的，两者缺一不可。假设检验均是以无效假设为出发点。;步骤 2：选定检验方法,计算统计量 ;步骤 3：确定P值,作出推断结论 ;P值的意义;步骤 3：确定P值,作出推断结论 ;步骤 1：建立假设，确定检验水准 ;步骤 2：选定t检验,计算统计量 ;步骤 3：确定P值,作出推断结论 ;假设检验的成功与否，建立在严格的设计的基础上：排除系统误差、严格随机，样本具有代表性。如何评价上述实例分析？;P值大小与均数差值的大小不同。假设检验只能表明总体均数间的差别有无统计学意义，不能表明差异是否显著。　;四、统计推断---参数估计;1、(1-?)可信区间;可信区间估计的优劣取决两个方面：一是可信度1??，即区间包含?的理论概率大小，愈接近1愈好。二是区间的宽度：精度，区间愈窄愈好。当样本含量为定值时，上述两者互相矛盾。若只顾提高可信度，则可信区间会变宽。;可信区间的属性1;准确度为99%：70.8 ? 77.6次/分;可信区间的属性2;样本量扩大后的可信区间： 25例扩大到50例;问题;2、95%可信区间与95%参考值范围;2）、计算公式：可信区间用标准误参考值范围用标准差;3）、用途可信区间：用于估计总体参数。参考值范围：判断观察对象的某项指标正常与否。;五、统计推断结果评价;（一）、统计推断结果的概率性 ;诊断性试验的评价四格表;统计结果的概率性：统计结果不是绝对肯定或否定，可能犯I、II型错误真实情况假设检验拒绝H0 不拒绝 H0