1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
debruijn图.doc

硕士学位论文 基于 de Bruijn 图的 DNA contig 生成算法 DNA CONTIG GENERATION ALGORITHM BASED ON DE BRUIJN GRAPH 王旭 哈尔滨工业大学 2011 年 6 月 中图分类号:TP319 学校代码:10213 UDC:621.3 密级:公开 工学硕士学位论文 基于 de Bruijn 图的 DNA contig 生成算法 硕 士 研 究 生 : 王旭 导 师 : 陈彬 副教授 申 请 学 位 : 工学硕士 学 科 : 计算机科学与技术 所 在 单 位 : 计算机科学与技术学院 答 辩 日 期 : 2011 年 6 月 授予学位单位 : 哈尔滨工业大学 Classified Index: TP319 U.D.C: 621.3 Dissertation for the Master Degree in Engineering DNA CONTIG GENERATION ALGORITHM BASED ON DE BRUIJN GRAPH Candidate: Wang Xu Supervisor: Associate Prof. ChenBin Academic Degree Applied for: Master of Engineering Specialty: Computer Science and Technology Affiliation: School of Computer Science and Technology Date of Defence: June, 2011 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工学硕士学位论文 -I- 摘 要 为了探索生命的本质,人们迫切希望快速地获得新物种个体 DNA 分子的全部 碱基序列。现在,新一代测序技术不断发展,但测序过程中 DNA 分子已被打碎成 碱基片段,于是从头测序被提出来了。随着第二代、第三代测序技术的产生,人 们能在较短时间内获得大量的测序数据。测序技术以高通量、低成本、高精度为 发展方向,现在积累的测序数据越来越多。如何快速、准确地处理海量测序数据 已成为 DNA 测序发展的瓶颈。 测序之前,DNA 分子要经过复制、打碎、过滤等过程,然后通过测序仪,把 DNA 片段读出,读出的 DNA 片段称为读取。要获得整个 DNA 分子的碱基序列, 首先要根据读取构造重叠群。重叠群是由读取相互重叠而成的 DNA 片段,并且重 叠群上的每个碱基都被一条读取所覆盖。在本文中,提出了一种新的重叠群生成 算法,叫 SRGA。该算法基于 de Bruijn图,将从头测序问题转化成一个四叉树的 搜索问题,并采用启发式搜索策略,能够快速地处理海量测序数据,而且能得到 质量较高的重叠群。 本文详细叙述了算法的原理以及实现过程。为了存储大量的读取,在本文中 使用了一种新的 de Bruijn图结构。为了引入启发式规则,决策表结构是必要的。 决策表中保存了正在参与拼接的读取,后继 k-mer 就是由这些读取决定的。当选定 后继 k-mer 时,决策表需要更新。算法中通过不断选取后继 k-mer,来扩展重叠群。 故后继 k-mer 的选取是一个非常重要的过程,只有选择了正确的后继 k-mer 才能得 到质量较高的重叠群。本文提出了读取锁定策略,即通过设置决策表中的锁定位, 将一些快要成功拼接的读取锁定,令后继 k-mer 由这些读取产生。这样可以保证重 叠群上每一个碱基都被一个成功拼接的读取所覆盖。 最后,本文将 SRGA 与 EULER 算法进行了比较。发现 EULER 产生的重叠群 较短,数量较多,单条重叠群与参考基因组匹配较好,但总体覆盖度较低。而 SRGA 能产生较长的重叠群,且使用了更少的时间与内存。虽然单条重叠群与参考基因 组匹配稍差,但总体覆盖度较高。 关键词:从头测序;启发式搜索;de Bruijn图;决策表 哈尔滨工业大学工学硕士学位论文 -II- Abstract In order to explore the esse

文档评论(0)

基本资料 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档