第3讲实验误差及其控制2011.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3讲实验误差及其控制2011

第三讲 实验误差及 其控制 第一节 误差分析与控制 数据的获得及处理过程中不可避免的产生误差,误差偏大,作出的统计结论将违背研究的真实性和可靠性,分析并控制数据的误差。 一、误差的基本概念 1. 误差: 测定值与真实值之差 2.真值: 真值( )即真实值,是指在一定条件下,被测量客观存在的实际值。 真值通常是个未知量,由于误差的客观存在,真值一般是无法测得的。 测量次数无限多时,它们的均数极为接近真值,故真值可定义为无限多次测定值的均数。 6.误差的表达与评价:通常用精密度、准确度和精确度来表达与评价。 (1)精密度(重复性) :表示测定结果中随机误差大小的程度。它是指在规定条件下对被测定值进行多次测定时,各次测定值结果之间离散的程度。 同一方法重复测定同一样品,测定值的一致程度。 精密度高则离散程度小,重复性大,随机误差小。 (2)准确度(测定值与真实值的接近程度) :表示测定结果中系统误差大小的程度。它是指在规定条件下,多次测定数据的平均值与真值符合的程度。准确度高则测定值接近真值程度高,系统误差小。 是准确的程度,指对同一事物的观察值与该事物真实值符合程度的大小(测定值与真实值的一致程度)。受系统误差控制,受随机误差影响。 (3)精确度(精密度与准确度的综合指标) :表示测定结果中系统误差与随机误差的综合大小的程度。它是指测定值结果的重复性及接近真值的程度。对于测定结果来说,精密度高,准确度不一定高;而准确度高,精密度也不一定高;只有精密度和准确度都高时,精确度才高。 随机误差(random error)又称偶然误差,是一类恒定的、随机变化的误差,由多种尚无法控制的因素所引起. 随机误差:随机测量误差、抽样误差 特征:单峰性、对称性、有界性、抵偿性 产生原因: 抽样误差:由于个体差异造成 随机测量误差:由于一些暂时的,无法控制的微小因素或未知因素造成。 c. 非线性系统误差   测定时间延续而呈曲线变化或周期性变化   糖皮质激素分泌:上午8-10点分泌高峰,午夜12点最低。   月经周期-雌激素变化 有效数字 控制实验误差的几种常用方法 ? 1.减少环境误差 检查仪器的使用条件是否得到满足,如温度、压 力是否符合要求,电磁场或光线有无干扰等 仪器设备使用状态是否满足设计要求,如水平、铅直、拉伸等状态是否调整好,光学仪器透镜器件等有否调整到共轴等高,电源电压供给是否达到要求值等。 总 结 系统误差可校正; 随机误差可控制; 过失误差可避免。 第二节 数据的缺失值 获得的实验数据首先应进行预处理,了解数据的基本特征。如: (1)数据的范围?(极差) (2)数据是连续资料还是离散资料?(分布类型) (3)均值、标准差是什么?(几何均数,算数均数、中位数等) (4)有无缺失值?数据的分布如何? (5)对多变量数据还要了解变量之间的相关性等。 解决这些问题的最简便方法是将这些原始数据放入SPSS软件的数据窗口,可根据需要逐一解决上述问题。 除数据的缺失值外,上面提到的统计概念都已叙述,这里只讨论数据的缺失值问题。 一、缺失值的概念 实验数据的缺失是数据分析中最常见的问题之一。 缺失数据可能的来源:仪器设备的原因或实验人员出错等。 流行病学的研究中缺失数据的原因:例如患者拒绝继续参加研究、治疗失败或成功、不良事件、患者搬家等,并不都与研究治疗相关。出现不同程度的数据不完整,或漏了一个或几次随访评价。即使完成了研究方案,仍可能有些数据未收集到。 整理数据时,弄清产生缺失数据的原因比掌握缺失数据的多少更重要。 只有搞清楚产生缺失值的原因,才有可能避免缺失值的产生。 如果缺失值的数量很多,则数据分析结果的解释总是会出现问题。 二、缺失值对数据分析的影响 简单从统计分析中排除有缺失结果数据来处理缺失值,会产生如下问题。 1.精密度下降 样本含量和分析结果的变化直接影响数据分析结论的精密度。样本含量越大则精密度越大,变异越小。缺失值的数量越大则精密度降低越明显。 数据不完整者出现离群值的可能性增大(治疗失败导致脱落、治疗效果非常好导致失访)。这些数据不完整者的缺失会导致数据资料的变异被低估,使治疗结果的可信区间变窄。 2.偏倚 缺失数据是导致偏倚的重要原因。虽然统计学精密度的降低主要与缺失值的数量相关,但在估计、评价治疗作用时偏倚的风险取决于缺失、治疗和结果三者之间的关系: 如果缺失值仅仅与治疗相关(治疗组与其他组相比观察缺失的可能性更大)而与未观察指标的实际值不相关(较差的结果与较好结果相比缺失的可能性更大),则理论上预期缺失值不会导致偏倚。 如果未测定的观察指标与结果的实际值相关

文档评论(0)

sandaolingcrh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档