- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                回归校准法对线性回归中信息偏倚校正的模拟研究.pdf
                    
主国里生缠i土!Q!!生!旦筮!Q鲞笠≥翅 
       回归校准法对线性回归中信息偏倚校正的模拟研究木 
    哈尔滨医科大学公共卫生学院(150086)张桥 张秋菊 陈  霞 李慧婷 陈永杰 杨建飞 刘美娜△ 
      【提要】 目的探讨回归校准法对简单线性回归中,符合正态分布或均匀分布的信息偏倚校正效果。方法通过 
   SAS软件模拟产生有信息偏倚的数据集,用回归校准法对信息偏倚进行校正,然后对比设定的真实卢值和校正后的卢‘值 
   之间的差别,来评价校正效果。结果无论信息偏倚符合正态分布还是均匀分布,回归校准法都能达到较好的校正效果; 
   在固定信息偏倚大小和验证数据集样本量,但不同口值的情况下,信息偏倚校正效果均较好;未校正时的声值都小于设定 
   的真实卢值,且信息偏倚越大,声值越小;随着验证数据集样本量的增加,回归校准法对信息偏倚的校正效果越好。结论 
   可以使用回归校准法对线性回归中符合正态分布或均匀分布的信息偏倚进行校正;在校正时要根据信息偏倚的大小来确 
   定合适的验证数据集样本量,以最少验证数据集样本量达到最佳校正效果;在有信息偏倚存在的线性回归分析中,一定要 
   对回归系数进行校正。 
      【关键词】 信息偏倚 回归校准法线性回归 回归稀释 
   信息偏倚是在科研领域中广泛存在的一个问题,              般为原始样本中按一定比例随机抽取出来的一个同时 
特别是在环境流行病学、膳食问卷调查等观察性研究               有w和x值的数据集,该数据集称为验证数据集。回 
中…。信息偏倚指在科研过程中由于信息收集、固有               归校准法的前提条件为w和x要为线性关系‘10’。 
的生物学变异和一些变量的主观性而造成的系统误 
                                                    模拟分析 
差心。3]。数据分析时忽略信息偏倚,将导致推断结果 
不精确H]。自上世纪80年代开始国外就有关于信息  1.模拟设计 
偏倚校正方法的文献报道¨J,其中在回归模型中校正                 模拟产生一个样本量N=300的自变量数据集,x 
信息偏倚的方法是由Rosner提出的回归校准法∞。7o, 
该方法可通过统计软件包实现分析过程¨。91。本文将 
通过模拟实验,探讨信息偏倚符合正态分布或均匀分 
布时,回归校准法对线性回归的校正效果。                   (1,3)的信息偏倚产生变量w,该数据集称为主要数 
                                      据集,建立y与w回归模型,得出未校正的回归系数 
            基本原理与方法 
                                      后。在主要数据集中随机抽取样本量为n=(10,20, 
   1.简单线性回归的基本形式 
   简单线性回归模型的基本形式为Y=a+膨+孝, 
                                      卢。W,通过此模型在主要数据集中推断x的估计值 
在一些观察性研究中,如膳食频率调查(FFQ),自变量 
                                      x+,用y与x+建立新的回归模型,获得校正后的回归 
为真实值,是被调查者过去一年中所吃各类食物的重 
                                      系数届+。 
量,通过问卷调查获取的值为真实值的估计值,其之间 
                                         在实际科研工作中,信息偏倚的类型和大小只能 
的差别就是信息偏倚。 
                                      估计,获取其估计值可通过如下途径:从样本量为肘 
   2.经典信息偏倚模型 
                                      的总样本中随机抽取样本量为,,l的样本K,其中m≥ 
   经典的信息偏倚模型为W=X+u,u符合均数为 
                                      10%木M∞】,用适当方法获取样本K中存在信息偏倚 
o,方差为or:的正态分布,且与x是独立的,模型中可 
                                      变量的真实值x,真实值x与估计值w之差就为样本 
以有E[wIX]=X这一推断¨0】。因为在有些观察性 
               
                您可能关注的文档
最近下载
- (高清版)DB62∕T 3175-2019 强夯法处理黄土地基技术规程.pdf VIP
- 最新苏教版三年级数学上册单元测试题及答案全册21套(最全).doc VIP
- 2025年《中国卒中中心建设指南》要点 .pdf VIP
- TCEPCA《构网型静止无功发生器现场系统调试技术规范》.docx VIP
- DB14T3520-2025水土保持梯田工程技术规范.pdf VIP
- GB50607-2010:高炉喷吹煤粉工程设计规范.pdf VIP
- AQ 2003-2018 轧钢安全规程(正式版).docx VIP
- SMT工艺能力单元6--掌握贴片设备和贴片工艺.pptx VIP
- 15D502 等电位联结安装.pdf VIP
- 就业社会政策..ppt VIP
 原创力文档
原创力文档 
                         
                                    

文档评论(0)