- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1 TEclass—a tool for automated classification of unknown
TEclass—a tool for automated classification of unknown eukaryotic transposable elements TEclass—一种可以自动分类未知真核生物转作因子的软件 讲演人:张曦 发表杂志: BIOINFORMATICS (生物信息学) 4.328 作者: 发表日期: Advance Access publication April 5, 2009 contents ABSTRACT 1 INTRODUCTION 2 METHODS 3 RESULTS AND DISCUSSION REFERENCES ABSTRACT Motivation原因:大量测序过的基因组需要新开发的软件来重建转座因子和其他重复元素的共有序列(the consensus sequences)。 然而在现有的软件常常集中于未知重复序列的分析。但是没有提供重建共有序列生物学分类。Teclass是一个工具,它可以将未知转座元素按照四个主要实用的生物类别分类,即可以反映转座方式: DNA 转座子,长末端重复序列(LTRs),非长末端重复序列(非LTRs:LINEs和SINEs)。 TEclass利用基于低聚物波段频率矢量( oligomer frequencies )的支持向量机算法support vector machine(SVM)来研究生物分类的工具。这个软件对于确定新的DNA和LTRs重复序列有90–97%的准确性,而获得LINEs和SINEs重复序列有75%。 Availability可利用性: pgen.unimuenster.de/teclass, stand alone program upon request. 1 INTRODUCTION 转座因子(TEs)在多细胞生物中大量存在。它们正确的识别是新测序过的基因组注释的关键一步。然而,为了注释这些重复序列,必须先确定它们的共有序列。传统上转座因子(TEs)被人工重组,但近年来发明了不少新的工具,可以在新测序过的基因组中重建(reconstruct)转座因子(TEs)。 例如: RepeatScout (Price et al., 2005) RECON (Bao and Eddy, 2002) RepeatModeler (/RepeatModeler.html) 这3个tools就与其它工具结合使用。 我们鉴定重复序列后经常得到转座因子共有序列,但不能提供转座因子重组序列的类型和机制。到现在只有很少的工具(象RepeatModerler)可以试图用序列相似性去归类新重组的共有序列。 转座因子相似性分类:可以利用与其序列非常相似的其他已知物种的序列来有效确定其序列。 随着测序的成本降低,越来越多的物种被测序,但直到现在为止生物分类系统却很少关注,新确定的转座因子(TEs)很少与已知序列相联系,因此它们的分类需要其他途径和方法。 1 INTRODUCTION 目前遇到的问题是:存在有许多不同种类的微生物是无法培养的,还有就是大量的新测序过的微生物DNA与已知生物的序列没有任何相似性。许多生物体低聚物的构成也截然不同。 这就只能在分类过程中利用低聚物(oligomer)剖面图与其相类似的剖面图来进行汇编序列。 TEclass,这个工具就可以将未知的转座因子(TEs)按照主要的生物学分类进行归纳。并且还能反映其转座机制。 ①DNA转座子、②LTRs、non-LTR(③LINEs和④SINEs) 2 METHODS 这些生物学分类的建立是利用大量真核重复序列的资料库(RepBase)中的TE序列。我们利用LIBSVM(Chang and Lin, 2001)来作为support vector machine(SVM支持向量机算法)的引擎( engine )。 分类过程分两部分(Fig.1) 。 forward versus reverse sequence orientation DNA versus Retrotransposon LTRs versus non-LTRs for retroelements LINEs versus SINEs for non-LTR repeats。 然后是是小于1800bp的序列的处理,这是因为我们并不了解SINEs是否大于1800bp。 归纳这些分类是在每一个长度(bp)种类和每一个分级阶段进行的。 在每一个分
您可能关注的文档
最近下载
- 栏杆工程施工组织设计(技术标).doc
- 2024北京一零一中初二(下)期中物理及答案.docx
- 跨学科实践活动09+探究土壤酸碱性对植物生长的影响(教学课件)-2024-2025学年九年级化学跨学科实践活动教学课件+设计(人教版2024).pptx VIP
- 2024年山东省滨州市中考化学试题附解析答案.pptx VIP
- 违反中央八项规定精神清单80条PPT深入贯彻中央八项规定精神.pptx VIP
- 外研社新一代大学英语(基础篇)综合教程B2U4 iExplore 2.pptx VIP
- 3-哈利波特与阿兹卡班的囚徒 中英对白剧本.pdf VIP
- 2024年社区工作者考试必背1000题题库及答案.docx VIP
- 计算小达人3年级数学下册人教版.pptx
- 初始过程能力研究计划.xls VIP
文档评论(0)