回归校准法对线性回归中信息偏倚校正的模拟研究.pdfVIP

下载本文档

55
0
约1.88万字
约 3页
2017-10-27 发布于北京
举报
版权申诉

回归校准法对线性回归中信息偏倚校正的模拟研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

回归校准法对线性回归中信息偏倚校正的模拟研究.pdf

主国里生缠i土!Q!!生!旦筮!Q鲞笠≥翅回归校准法对线性回归中信息偏倚校正的模拟研究木哈尔滨医科大学公共卫生学院(150086)张桥张秋菊陈霞李慧婷陈永杰杨建飞刘美娜△ 【提要】目的探讨回归校准法对简单线性回归中，符合正态分布或均匀分布的信息偏倚校正效果。方法通过 SAS软件模拟产生有信息偏倚的数据集，用回归校准法对信息偏倚进行校正，然后对比设定的真实卢值和校正后的卢‘值之间的差别，来评价校正效果。结果无论信息偏倚符合正态分布还是均匀分布，回归校准法都能达到较好的校正效果；在固定信息偏倚大小和验证数据集样本量，但不同口值的情况下，信息偏倚校正效果均较好；未校正时的声值都小于设定的真实卢值，且信息偏倚越大，声值越小；随着验证数据集样本量的增加，回归校准法对信息偏倚的校正效果越好。结论可以使用回归校准法对线性回归中符合正态分布或均匀分布的信息偏倚进行校正；在校正时要根据信息偏倚的大小来确定合适的验证数据集样本量，以最少验证数据集样本量达到最佳校正效果；在有信息偏倚存在的线性回归分析中，一定要对回归系数进行校正。【关键词】信息偏倚回归校准法线性回归回归稀释信息偏倚是在科研领域中广泛存在的一个问题，般为原始样本中按一定比例随机抽取出来的一个同时特别是在环境流行病学、膳食问卷调查等观察性研究有w和x值的数据集，该数据集称为验证数据集。回中…。信息偏倚指在科研过程中由于信息收集、固有归校准法的前提条件为w和x要为线性关系‘10’。的生物学变异和一些变量的主观性而造成的系统误模拟分析差心。3]。数据分析时忽略信息偏倚，将导致推断结果不精确H]。自上世纪80年代开始国外就有关于信息 1．模拟设计偏倚校正方法的文献报道¨J，其中在回归模型中校正模拟产生一个样本量N=300的自变量数据集，x 信息偏倚的方法是由Rosner提出的回归校准法∞。7o，该方法可通过统计软件包实现分析过程¨。91。本文将通过模拟实验，探讨信息偏倚符合正态分布或均匀分布时，回归校准法对线性回归的校正效果。 (1，3)的信息偏倚产生变量w，该数据集称为主要数据集，建立y与w回归模型，得出未校正的回归系数基本原理与方法后。在主要数据集中随机抽取样本量为n=(10，20， 1．简单线性回归的基本形式简单线性回归模型的基本形式为Y=a+膨+孝，卢。W，通过此模型在主要数据集中推断x的估计值在一些观察性研究中，如膳食频率调查(FFQ)，自变量 x+，用y与x+建立新的回归模型，获得校正后的回归为真实值，是被调查者过去一年中所吃各类食物的重系数届+。量，通过问卷调查获取的值为真实值的估计值，其之间在实际科研工作中，信息偏倚的类型和大小只能的差别就是信息偏倚。估计，获取其估计值可通过如下途径：从样本量为肘 2．经典信息偏倚模型的总样本中随机抽取样本量为，，l的样本K，其中m≥ 经典的信息偏倚模型为W=X+u，u符合均数为 10％木M∞】，用适当方法获取样本K中存在信息偏倚 o，方差为or：的正态分布，且与x是独立的，模型中可变量的真实值x，真实值x与估计值w之差就为样本以有E[wIX]=X这一推断¨0】。因为在有些观察性