关联分析中统计方法研究:基因模型选择及稳健检验.pdf

关联分析中统计方法研究:基因模型选择及稳健检验.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考!!!

摘 要 摘 要 关联分析是寻找人类疾病易感基因的主要工具,常用的数据采集方法有病 例对照设计、匹配病例对照设计和家系设计。关联分析的一个关键问题是在各 种设计下如何提高统计检验的功效。理想条件下,群体中的基因形态处于哈代一 温伯格平衡律所刻画的稳定平衡态。对平衡态的偏离,即哈代.温伯格不平衡 态,蕴含了变异或与疾病的关联。特别地,等位基因相互作用机制即基因模型的 信息可以由偏离哈代.温伯格不平衡律的模式来决定。本论文研究在不同的设 计下,如何利用偏离哈代.温伯格平衡律的信息估计基因模型,并由此得到各种 稳健和有效的检验方法。 关联分析中常用的统计检验方法有两类:一类为不考虑基因模型的卡方 检验(比如Pearson卡方检验)方法;另一类为考虑基因模型的趋势检验(如 Cochran-A啪itage趋势检验)方法。前者不依赖于基因模型指定,因而比较稳健, 但由于忽略了基因模型,其检验功效可能会有部分损失;后者是针对特定的基因 模型而设计的检验,在基因模型指定正确的条件下具有最大的功效。但是,由于 对复杂疾病的认识有限,在实际应用中真正的基因模型通常无法精确确定,所以 在这种情况下使用错误基因模型所对应的趋势检验反而会导致功效的损失。结 合两者优势的检验称为稳健有效型检验,其中,MAX检验和基因模型选择是普 遍采用的两种稳健方法,对于一般的病例对照数据有了广泛的研究。但是对于 其它重要抽样设计,如何估计基因模型还缺乏研究。比如匹配病例对照数据中 的模型选择、家系数据中的模型选择问题以及全基因组关联分析两步设计中的 基因模型选择等。本文针对以上三种特定的抽样设计研究模型选择的问题,并 研究相关的稳健检验方法。 病例对照设计的一个主要缺陷是混杂因素会引起统计推断的偏差,匹配设 计和家系设计是控制混杂因素的两个常用方法。对于这两种设计,文献中已有关 于MAx检验的相关讨论,但是基于基因模型选择的稳健方法则尚无相关研究。 模型估计的难点在于数据分层结构的处理,传统的针对于病例对照设计的哈代 .温伯格不平衡检验不再适用,需要构造新的检验方法估计基因模型。对于匹配 的病例对照设计,本文基于列联表的行、列边际构造哈代.温伯格不平衡检验并 摘 要 构造了稳健检验;对于家系设计,我们从条件似然函数的计分检验导出哈代.温 伯格不平衡检验,并用于估计基因模型和构造稳健检验。理论证明、计算机模拟 和实际数据分析均表明,我们所提出的模型选择方法对于基因模型有较高的正 确判别率,并且基于模型选择的趋势检验在诸多现存的稳健方法中具有最大的 稳健有效性。 全基因组关联分析中的两步设计是一种广为采用的设计方法,其目的是为 了提高检验的效率和减少实验费用。我们研究的两步设计中,第一步利用DNA 混合技术对全基因扫描的几十万个单核苷酸多态体(SNP)进行初步筛选,通过 筛选的SNP进入第二步,实施基于模型选择的关联分析。在分析方法上,我们 使用联合分析方法将所有的样本信息综合考虑得出关联性结论。模拟试验结果 表明,即使基因测量存在合理的误差,烈妊混合技术可以在不降低检验功效的 前提下大量节约基因检测的成本,而联合分析方法结合两个阶段数据进行分析, 可以提高关联分析的功效。因此对于全基因组关联分析,我们提出的方法是一 个成本有效的检验方法,具有广泛的应用价值。 合的MIN2方法,并将该方法推广到具有多重排序的列联表中。我们不仅从理论 上推导了零假设下MlN2和它的p值的渐近分布,还研究了它们的理论性质,对 于实际应用具有理论指导意义。模拟试验和实例分析证实了所提方法不仅适合 出其它检验统计量所不能检测到的关联性。总之,MIN2简单易操作,不仅适用 于基因数据分析也适用于一般的具有多重排序的列联表数据分析。 关键词:基因关联分析,病例对照设计,家系数据,匹配,全基因组研究,Pearson 基因模型选择,稳健检验,成本有效设计 Ⅱ AbStraCt Geneticassociationis usedtodetect ofhu- analysiscommonly susc印tiblegenc mandisease.Case—com

文档评论(0)

wwqqq + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档