l一文解析临床研究中的偏倚及控制方法.docxVIP

下载本文档

6
0
约5.28千字
约 10页
2017-01-12 发布于北京
举报
版权申诉

l一文解析临床研究中的偏倚及控制方法.docx

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

l一文解析临床研究中的偏倚及控制方法

一文解析临床研究中的偏倚及控制方法在临床科研过程中，我们都致力于一点，就是让分析所得的关联性（association）尽量接近病因性（causation）。除了应用统计学方法以外，非常重要的就是从根本上分析造成偏倚（bias）的原因并控制误差和偏倚。正如LinkLab前文所提及的，我们需要重点分析和排除的误差包括：随机误差和系统误差（bias），以及发现和解释效应修正（effect modification）。其中随机误差是随机分布且不可预测的，因此除了增加样本量或重复测量取均值外别无他法。但对于系统误差和效应修正却可以得到控制或解释，帮助理解所得结论。系统误差包括：混淆偏倚（confounding）、选择偏倚（selection bias）和信息偏倚（information bias）。其中，信息偏倚(information bias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差，其原因是由于诊断疾病、测量暴露或结局的方法有问题，导致被比较各组间收集的信息有差异而引入的误差。本文将不对其进行描述。阅读此文前强烈建议您阅读LinkLab 2015年11月6日《流行病学也好玩（四）：一种方法教会你理清科研思路》，之后就能轻松理解清楚误差和偏倚，以及有效的解决方法。混淆偏倚（confounding）E：暴露变量（exposure）；Y：结果变量（outcome）；C：混淆因素在研究暴露与疾病的联系时，C作为混淆因素（confounder）必须满足：1）与exposure相关联；2）与outcome相关联且不是因为exposure；3）不在E和Y的因果链上。但并不是满足这三个条件就是混淆因素。由于混杂变量的存在，造成了观察到的联系强度偏离了实际情况，则称为混杂偏倚。小测试：假设A＝exposure，Y＝outcome，哪些图的L不是混淆因素呢？答案就是最后一个图。混淆因素严重干扰我们对于risk的估计，所以必须想办法控制这些variable。但是有时候因为我们需要考虑的混淆因素不可测量，为了能够分析出真实的结果，可以使用surrogate confounder来控制混淆因素。如下图：U为不可测量的混淆因素，为了控制U，我们可以替代使用能够代表U的其他变量L来分析。比如，我们需要考虑社会地位这个因素，因为无法测量社会地位，所以我们可以使用教育、收入、住址、学历等因素代表社会地位进行分析。切忌：当进行统计分析的时候，务必仅考虑混淆因素而不对非混淆因素进行处理，所以并不是考虑的因素越多越好。因为分析时控制的混淆因素越多，则分析的power越低，甚至因为控制某一非混淆因素而引入新的混淆因素。如下图：本身该DAG不存在混淆因素，但是如果误把L当成了混淆因素对其进行控制时，U1，U2则变成了混淆因素对A与Y的相关性产生干扰。如何去除混淆因素对分析结果的影响呢？在试验设计阶段，我们可以采取：1）随机化（randomization）：可以有效控制已知和未知的confounders；2）匹配（matching）和限制（restriction）：可以控制已知的confounders；限制：如果认为某个或某些因素是可能的或已知的混杂因素，在设计过程中，可对研究对象的选择条件进行规定，但限制条件不宜太多。如研究冠心病与吸烟的关系，年龄与性别可能是混杂因素，就规定本次调查仅限于40-50岁的男性居民。匹配（matching）：个体配比将每个指示病例选择一个或多个对照，该对照与病例具有某些相同的特征，如年龄、性别等，在各比较组有相同的分布，以达到清除混杂作用的目的。频数配比将使对照组在某个潜在的混杂变量的分布与指示病例组的分布相同，如暴露组30-39岁为30%，40-49岁为30%，50-59岁为40%，那么非暴露组应与暴露组有相同的年龄分布。3）选择不存在混淆因素与暴露相关的研究人群在数据分析阶段，仅可以对已知的混淆因素进行控制。我们可以进行：IP weighting/standardization：通过标准化人群，让混淆因素在暴露和非暴露人群中的分布是相同的，从而去除混淆因素对分析结果的影响；stratification-based methods（包括stratified analysis, restriction, regression…）：通过研究各个混淆因素水平下（假设各个水平下混淆因素不影响exposure和outcome的相关性），exposure和outcome的相关性以去除混淆因素对结果的影响。选择偏倚（selection bias）A：暴露变量（exposure）Y：结果变量（outcome）C：混淆因素（confounder）选择偏倚(selection bias)是由于选择研究对象的方法有问题，使入选者与未入选者