基因型带有误差时单倍型分析的统计方法-概率论与数理统计专业论文.docxVIP

基因型带有误差时单倍型分析的统计方法-概率论与数理统计专业论文.docx

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因型带有误差时单倍型分析的统计方法-概率论与数理统计专业论文

摘 摘 要 单倍型在现代遗传流行病学研究中起着非常关键的作用,尤其是在进行复杂 疾病基因定位研究时,基于单倍型的连锁分析或关联分析方法比基于单个SNP 位点的分析方法有更大的功效.但实际中我们直接得到的不是个体的单倍型而是 基因型,因此单倍型分析的首要任务就是根据已知的基因型数据推断个体的单倍 型,其次是利用得到的单倍型进行连锁分析和关联分析的研充然而目前已有的 单倍型分析的统计方法(包括单倍型推断方法和基于单倍型的连锁分析与关联分 析方法)几乎都没有考虑基因型测量误差给单倍型分析带来的影响,它们均是在 基因型不含有测量误差的假设下进行的,问题是目前所用的大部分基因型数据都 含有一定的误差.本文的主要目的就是给出基因型带有测量误差时单倍型分析的 统计方法,其中主要包括单倍型推断方法和单倍型关联分析的方法. 本文分别就群体数据结构和家系数据结构给出了基因型含有测量误差时的 单倍型推断方法,并且给出了降低基因型误差影响的单倍型关联分析的方法.首 先在群体结构的单倍型推断研究中,我们提出了两种全新的设计方法。双重抽样 设计和多次测量设计,并基于这两种设计方法提出了适合于含有误差基因型的单 倍型推断的DS—EM算法和MG—EM算法.对于家系数据结构,我们充分利用家 系中个体之间有用的相关信息提出了基因型含有误差时单倍型推断的GS—PEM 算法在进行单倍型关联分析的研究时,我们就病例一对照研究中基因型含有误 差情况下考虑了基于单倍型的logistic回归模型,给出了单倍型关联分析研究的 似然方法.上述各种方法我们都通过模拟研究或实例分析考察其在实际中的可行 性,并且通过和其他方法的模拟比较研究去分析其优劣性.无论是理论分析还是 模拟研究都说明我们的方法在实际中是可行的,并且能够大大降低基因型测量误 差给单倍型分析带来的影响. 关键词:单倍型推断;单倍型关联分析;基因型误差;基因图谱;误分类;双 重抽样;EM方法;logistic回归 I AbstractHaplotype Abstract Haplotype plays a very important role in modern genetic epidemiology stud— ies Especially,in the study of mapping common complex disease genes,haplotype- based methods,such as linkage analysis and association analysis,are inore power— ful than single SNP marker methods.In practice,however,what we can obtained directly are genotype data but not haplotype data.The basic problem of hap— lotype analysis is that we should infer haplotypes of each individual according to the available genoWpe data,then we should perform haplotype—based link— age analysis and haplotype—based association analysis.Nevertheless,almost all of the existing haplotype analysis(haplotype inference,haplotype-based linkage analysis and haplotype—based association analysis)neglect the impact induced by genotyping errors,which perform haplotype analysis under the assumption that genotype data do not contain errors.The major issue is that all large geno- type data,especially for SNP markers,contain errors due to fallible genotyping technologies.This dissertation aims to propose some new statistical methods for haplotype analysis with genotyping errors. In this di

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档