一种基于关联性特征宏基因组测序片段分装方法.pdfVIP

一种基于关联性特征宏基因组测序片段分装方法.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2013 年 第 58 卷 第 27 期:2854 ~ 2860 《中国科学》杂志社 论 文 SCIENCE CHINA PRESS 一种基于关联性特征的宏基因组测序片段分装方法 丁啸, 张倩倩, 曹唱唱, 孙啸* 东南大学生物电子学国家重点实验室, 南京 210096 * 联系人, E-mail: xsun@ 2012-11-19 收稿, 2013-01-16 接受 国家重点基础研究发展计划(2012CB316501)资助 摘要 20 世纪末宏基因组学的概念被首次提出, 从此打开了利用宏基因组学方法和技术研究 关键词 微生物的大门. 随着高通量测序技术的成熟, 宏基因组学已经成为了一门新兴的热门学科. 序 宏基因组 列分析是宏基因组学研究的基础, 而序列分析的一个重要环节就是测序片段的分装(binning). 分装 分装的准确性直接影响宏基因组学研究的精度和效率, 提高分装准确性的关键在于提取出一 关联性特征 机器学习 种反映宏基因组测序片段物种分类的序列特征. 目前主流分装方法利用的都是基因组序列的 碱基组成性特征. 本文深入研究序列的关联性特征, 提出了一种基于关联性特征的分装方法, 结合机器学习算法实现准确的分装, 在对不同物种层次和不同复杂度的模拟宏基因组测序数 据集进行分装时都能保持良好的性能. 通过对比, 发现此方法分装的正确率和稳定性都要优于 目前国际上的无监督分装算法以及那些单纯使用三联、四联核苷酸出现频率进行分装的算法. 在微生物的研究领域中, 传统的遗传研究方法 着新一代 DNA 测序技术和生物信息学的发展, 宏基 是对单一微生物进行单纯培养, 然后再对其进行分 因组学的研究方法也有了很大的进步. 离测序研究, 这样的方法停留在单一微生物物种的 宏基因组学研究的首要目的就是对一个环境样 水平上. 目前保守的研究表明, 环境中只有最多 5% 本中所有的微生物物种进行区分, 并识别出它们各 的微生物能够使用常规的方法进行培养, 所以传统 自在代谢中所起的作用. 在传统单一培养微生物的 的方法在很大程度上受到了限制. 于是人们提出了 方法中, 测序过程是针对的单一纯品克隆样本的, 所 一种能够研究大量未知微生物的方法, 即利用宏基 获得 DNA 片段也是来自于同一基因组. 宏基因组测 因组学的手段研究微生物. 宏基因组是指环境中全 序的样本是多种微生物基因组的混合体, 其中包括 部微生物基因组DNA 的总和, 最早是由Handelsman 几十甚至上千种微生物, 而且很多微生物都是未知 等人[1]于 1998 年在一篇研究土壤微生物的文章中提 的, 所以分析宏基因组测序数据时, 就需要引入一个 出. 宏基因组学也称为微生物环境基因组学, 就是利 特有的步骤称为分装[5], 即将宏基因组测序片段按照 用序列分析和功能基因筛选的研究方法, 以微生物 物种分类. 分装本质上是一种特殊的聚类方式, 指对 的多样性、群落结构、进化关系、功能活性以及物种 宏基因组测序片段进行重叠区域保守拼接后根据一 与环境之间的关系作为研究目的的一门新兴学科. 定的规则进行聚类. 聚类的物种层次精度不一样, 精 随着高通量测序技术的成熟, 宏基因组学的方法已 确的可以聚类至种的级别, 而粗糙的只能聚类至界、 经成为研究微生物的一种重要手段. 宏基因组学

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档