- 8
- 0
- 约2.43万字
- 约 20页
- 2016-11-07 发布于江苏
- 举报
10 利用核酸序列的预测方法 James W. Fickett
SmithKline Beecham Pharmaceuticals
King of Prussia. Pennsylvania 这一章讨论的是解释DNA序列的方法,这些方法主要依赖于功能模式的检测,而不是与其它单个序列的比较。这些方法中的绝大部分意在先寻找并遮蔽重复的和低复杂性的序列,再寻找基因以及与其相关的调控区域。在针对单个序列的集中调查分析,以及为可能的基因、整个基因组或相应较大区域建立初步清单的快速扫描过程中,这些方法都发挥了主要作用。由于算法开发迅速,没有一种工具能完成全部有关的序列分析功能。因此,有必要将序列提呈给多个不同的软件包加以分析,以利用最佳的计算机技术。为使这一过程效率更高,本章为当前常用的工具提供了简明的使用指导。一些有用的资料还能从Wentian Li编辑的在线书目(见本章末“书目…”中所列资源中的URL地址)和参考文献中的相关综述中找到:Gelfand(1995),Claverie(1996),Fickett和Guigó(1996),Snyder和Stormo(1996),以及Guigó(1997)。
这一章是这样安排的:首先,是对基本概念框架的描述,以将各不同工具安排在合适的位置上;然后,是对主要的计算工具的评述,对每种工具,既讨论了其内在逻辑思想,也给出程序应用的范例。当前的诸多工具虽很实用,但绝非完全可靠。例如,当前的发展中存在的一个缺陷是许多序列分析软件开发者对功能域原型的描述来自DDBJ/EMBL/GenBank等国际序列数据库中对相应功能域的描述,然而这些数据库中的描述本身的部分却可以来源于序列的分析,这样就导致了循环。在应用中,每种分析方法各自的优势和不足都该特别留意。一些最常用的和可以从互联网上获得的计算工具列于章末。
框架
一个全面的基因搜寻方案,无论是由单个复合程序实现还是通过使用多个专门程序来实现,以下的基本信息都是适用的。首先,搜寻基因的证据由多处收集而来:
一张标出重复序列位置的图谱表明了该处调控区域和编码蛋白质的区域不太可能出现。
与其它基因或基因产物有序列相似性是外显子的强有力证据。
一段序列上存在着统计的规则性,表示为显著的“密码子偏好”是蛋白编码区最明显的标志之一。
与模板模式相符可能指出DNA上功能性位点的位置。这类分析可以基于很简单的模式(例如,众所周知的“TATA box”和剪接点的保守序列)或基于相当复杂的推理(例如,在后面将提到的启动子搜寻算法中)。
然后,全部收集到的信息汇总整理成总体上尽可能连贯的谱图。用于汇总整理阶段的准则属于基本常识:例如,由“密码子偏好”分析出的外显子边界可能为了有一个更好的剪接位点而进行轻微调整;在存在与已知蛋白序列的相似性时,序列的“密码子偏好”性也会更受重视。
对于特定的质询,诸多基因辨识程序中仅有少数可能与之相关。在构建一个方案时,一些主要问题是值得注意的:(1)对真核生物序列,遮蔽重复序列应先于其它分析过程;(2)大多程序都有特定生物物种适用性;(3)许多程序只能特定适用于基因组DNA数据或者只适用于cDNA的数据;(4)序列的长度也是一个重要因素。例如,用鸟枪法测序得到的单个序列片段很少能用设计为在序列中搜寻整个基因的老式程序加以分析。
遮蔽重复序列
在进行任何真核生物序列的基因辨识分析之前,最好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶Ⅱ转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。这样,这些重复序列的定位能为其它基因特征的定位提供重要的反面信息。重复序列还常常会搅乱其它分析,特别是在数据库搜索中。
对于偶尔分析一个序列而言,基于电子邮件或Web网页的服务器就足够了。CENSOR(Jurka等,1996)与RepertMasker(Smith,1996)就是这种能提供标识和遮蔽散布和简单重复序列的服务器。可以通过电子邮件,或用WWW界面实现(地址见章末列表)。图10.1显示的是一个有CENSOR进行重复序列分析和遮蔽的例子。
对于大量分析工作而言,在本地安装分析软件就更有效和必要。显然,本地分析也大大增强了保密性。从因特网上可以得到XBLAST(Claverie,1996)(不要与BLASTX混淆)的源程序。许多重复序列能从由J.Juka收集的Repbase中得到。J.M.Claverie也在XBLAST软件中包含了一组收集整理的Alu序列。对本地安装软件,把克隆载体序列加入收集的重复序列中也很有用,以便使在进行分析时,把克隆载体也一并遮蔽。
(a)
; HUMCKMM1
HUMCKMM1
ggatccttcctccttggcctcccaaagtgctgggattacaggtgtgag
您可能关注的文档
- 课内生物技术制药课程论文写作格式.doc
- 课内实验心理学大纲.doc
- 课内实验心理学试卷及答案.doc
- 课内生物化学实验讲义-正式-1.doc
- 课内生物信息学报告4.doc
- 课内实验设计与数据处理论文82799.doc
- 课内实验心理学85152.doc
- 课内生物统计学5.doc
- 课内生物学单词-4.doc
- 课内生物化学实验47656.doc
- OBE欧贝结算管理用户手册.pdf
- Zhejiang电力行业规范说明书用户手册.pdf
- Wuhu Electronic Certification 用户手册说明书.pdf
- MLBioELISA试剂盒ml103656说明书用户手册.pdf
- Beijing政务公开服务手册无型号说明书用户手册.pdf
- ZJDB建筑工程合同说明书用户手册.pdf
- CitCorp竹懋科技车用电子料件CN 362744 CN 312861 CN 449005说明书用户手册.pdf
- Elabscience磷酸盐比色法测试盒品类信息型号信息说明书用户手册.pdf
- BaiRui贝锐向日葵Q0.5用户手册.pdf
- LICHEN ROTATIONAL VISCOLOGY MEASUREMENT DEVICE USER’S INSTRUCTION说明书用户手册.pdf
最近下载
- 光伏电子产品的设计与制作-电子课件项目3-光伏草坪灯控制电路的设计与制作.pptx VIP
- 2024-2025学年江苏信息职业技术学院单招《数学》试卷含答案详解【考试直接用】.docx VIP
- 党员个人自评总结3篇-党员个人自评 党员个人自评小结 党员个人自评总结3篇.doc VIP
- 人教版英语新目标八年级下册第二单元教材词汇及重点搭配讲解.docx VIP
- 2026年演出经纪人《思想政治与法律基础》真题库及参考答案一套.docx VIP
- 索拉非尼治疗肝癌.pptx VIP
- 【高清可复制】HGT21629-2021 管架标准图_251-300.pdf VIP
- 新版人教版七年级下册地理全册教案(完整版)教学设计.docx
- 2025年北京事业单位真题.docx VIP
- 临时用地表(可编辑).pdf VIP
原创力文档

文档评论(0)