基于BioNano图谱的基因组结构变 异检测方法研究和应用-应用统计专业论文.docxVIP

基于BioNano图谱的基因组结构变 异检测方法研究和应用-应用统计专业论文.docx

  1. 1、本文档共89页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论文题目:基于 BioNano 图谱的基因组结构变异检测方法研究和应用 学科专业:应用统计 学位申请人:李淑祯 指导教师:岳荣先 摘 要 基因组结构变异(SVs)是遗传多态性的重要组成部分,也是一些疾病 发生的重要原因。随着生物技术的提高,对于全基因组结构变异的检测与 分析成为可能,这对生物学和医学产生了深远的影响。在理想的情况下, 人们希望在核苷酸水平上完整地记录一个采样基因组,再与参考序列进行 比对从而更加精确地检测结构变异。尽管我们现在完成了一些物种基因组 的参考序列的检测,但是由于实验设备、实验环境、项目经费等各种原因, 这一想法仍然不能实现。为了应对这些挑战,我们采用了高通量、高性价 比的基因组 BioNano 光学图谱技术,使用长单分子(大于 150 KB)来全面 揭示基因组的结构变异。 对于小的生物(如微生物)的基因组,光学图谱的使用已经是非常普 遍的了。而对于大型生物(如哺乳动物)的基因组,光学图谱的使用也在 飞速发展。然而,这一发展,提出了重要的新的计算问题和统计问题。参 考基因组与取样基因组相比较,两者的不同可能就是变异,但也有可能是 数据本身的问题。在本篇论文中,我们探讨了在大基因组的背景下,利用 光学图谱数据所产生的统计问题。特别地,我们强调突出了在光学图谱数 据中的误差并对其进行模型。同时,我们利用隐马尔科夫模型对得到的拷 贝数数据进行建模,来检测基因组中拷贝数的多态性。这里描述的拷贝数 分析方法是一个快速的简单的工具,能够有效地对光学图谱的基于组装的 分析进行补充说明。 本文选取人类基因组 YH 数据的 BioNano 光学图谱数据作为样本数据, 人类基因组参考版本 hg19(Human Genome version 19)作为参考基因组数 据,对 22 条常染色体和两条性染色体进行比对研究。通过将 BioNano 光学 I I II 图谱数据 YH 进行读取和拼装,与基因组参考序列进行比对,利用分子大 小误差统计模型和位点误差模型,我们获得了长度大于 1 KB 的 698 个插 入/缺失和 19 个倒置。去除与参考序列 hg19 的 N-base 空缺重叠的 62 个结 构变异,我们保留了 636 个非空缺的结构变异,并且有 604 个(约占 95%) 能得到公共数据库中的历史证据或者实验正交方法的支持。同时,本文使 用隐马尔科夫模型对基因组中拷贝数的多态性进行检测研究,拟合得到的 状态走向与基因组的拷贝数变化相一致,效果非常显著。本文基于 BioNano 光学图谱的基因组结构变异的检测方法是一个比较全面的和具有成效的方 法,希望能为后续的基因组结构变异的研究提供一些参考。 关键词:BioNano 图谱;基因组结构变异;隐马尔科夫模型;拷贝数多态 性 论文类型:应用研究 Abstract Structural variants (SVs) are collectively account for a significant fraction of genetic polymorphism and diseases. Whole genome analysis of variation is becoming possible with improved biotechnology, and this is anticipated to have profound implications for biology and medicine. Ideally, one would like to record a sampled genome at the nucleotide level, but this goal remains beyond our reach in spite of the fact that we now have a finished reference copy for several species. To address these challenges, we applied a high-throughput, cost-effective genome BioNano optical mapping technology to comprehensively discover genome-wide SVs using long single molecules (>150 kb) in a global fashion. Optical mapping is well developed for small (e.g. microbial) genomes, and recent advances have enabled optical mapp

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档