LTR查找器使用手册.doc

下载文档

10
0
约3.84千字
约 8页
2017-09-03 发布于重庆
举报
版权申诉
保障服务

LTR查找器使用手册.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

LTR查找器使用手册

LTR查找器使用手册 1.0.2版本李顺 2011.11.13 1 十进位计数法 1.1 LTR逆转录转座子的结构这是整个LTR逆转录转座子的典型结构的图示。 LTR区域：5LTR和3LTR是两个小的区域。当LTR逆转录转座子被插入到宿主基因组时，5LTR和3LTR这两个小区域可以被辨别出来，并且一旦被插入，这两个小区域就开始自主复制。变异和缺失在它们自主复制过程中经常发生。一个典型的LTR逆转录转座子有一个TG...CA的结构（TG在5LTR的5端，CA在3LTR的3端）。 TSR区域：TSR是位于5和3端侧面的一条4-6bp的短的直接重复带。它是转座因子成功插入宿主的标志。 PBS：在5LTR的3端附近，存在一段18bp长的序列，这段序列是某些tRNA的补充物。这段序列很重要，因为tRNA的掺入过程是逆转录开始的第一步。 PPT：聚嘌呤片段是一段富集嘌呤的短片段，全长大概11-15bp。正如PBS一样，PPT这段片段对逆转录很重要。蛋白域：在典型的病毒基因组中有三段多基因：gag,、pol和env。在这三段多基因中，pol是最保守的。在pol中有三个重要基因区域：IN（整合酶）、RT（逆转录酶）和RH（H核糖核酸酶），这些都是用于插入和逆转录的酶。RT和IN对自主复制的LTR单元正常行驶功能有重要作用。在进化这些信号可能会变得模糊或甚至无法检测一种基于后缀数组的算法然后史密斯沃特曼算法用于调整RT 鉴定包括动态规划处理转移对于其他蛋白域，如果他们发生，LTR 查找器调用ps扫描定位重要酶的核心。输入数据 2.1 形式 LTR查找器只接受FASTA 形式的序列并且只有不间隔的标示符才能被记录下来，以辨别被输入序列，而其他标示符将被忽略，不被记录下来。以下是输入的一个例子：以上是染色体Ⅰ和染色体Ⅱ的部分序列 2.2 序列大小的限制 LTR查找器只能呈byte以下的序列。上传序列的超时限制为 60 分钟完整的输出摘要输出和图输出完整的输出摘要输出虽然查找器直接输出了数据，有些区域还是要进一步说明。分数分数是0到11整数是一个介于 0 和 1 之间的十进制数。 11 位二进制字符串（老师，公式编辑器那里我找不到减号，只有加减号）其中Minside和Moutside分别表示左边和右边视野中碱基对的数量，将中心位置放到边界位置就可以获得其清晰度。 PBS和PPT 对于PBS，方括号内的第一个数字方括号内的第一个数字括号括起来的字符串是 tRNA 类型和反密码子 3.3图像形式的输出如果选择用图像输出结果，LTR查找器将用PNG逆转录转座子的相应位置。产生的图像是用普通的轴线和对数轴线标识的。浸没在银溶液中的元件将按他们的实际大小在图像上显示出来，即1像素代表1对数底数。浸没在蛋清液中的元件将被显示在对数轴上，因而元件之间的距离将被调整，才能被放在小的粗帆布上。蓝色的圈表示PBS，棕色的圈表示PPT，在LTR边界上紫色的圈表示TSR。参数 LTR查找器有很多参数，这些参数可以被分成两组：用于查找LTR逆转录转座子的参数（结构参数）和用于筛选（过滤）不可信结果的参数【筛选（过滤）参数】。第一组参数包括-o、-t、-e、-m、-u、-D、-d、-L、-l、-p、-g、-J、-j、-s、-a和-r，第二组参数包括-S、-B、-b、-w、-O、-P和-F。 4.1 -o， Gap open penalty(正整数) -t，Gap extend penalty(正整数) -e，Gap end penalty(正整数) -m，匹配率(正整数) -u，错配率(负整数) 这五个参数控制线性算法。将gap open penalty标记为Popen，把gap extend penalty标记为Pext，把gap end penalty标记为Pend，把匹配率标记为Smatch，把Smismatch，分比率和总比率分别由下列公式可得：分比率=Smatch ·Nmatch +Smismatch ·Nmismatch- ∑Pinner -gap 总比率=Smatch ·Nmatch +Smismatch ·Nmismatch- ∑Pinner -gap-P5 gap -P3 gap 其中Nmatch表示碱基配对数，Nmismatch表示碱基错配数。另外：其中inner-gap-len是末端碱基的长度。通常Popen比Smatch高。 4.2 -D，LTR之间的最大距离（正整数） -d，LTR之间的最小距离（正整数）