EMBOSS工具使用总结.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
EMBOSS工具使用总结

EMBOSS 工具使用总结 EMBOSS 是The European Molecular Biology Open Software Suite的缩写, 是一个开放源代码的序列分析软件包,它是一组为分子生物学家所设计的公开且 免费软件。该软件能够自动识别处理以不同格式存储的数据,甚至可以通过互联 网提取数据,此外同软件包一同提供的还包括大量的程序库,软件包整合了 100 多个的序列分析程序,可以满足一般实验室的各种各样的序列分析要求。并且, 因为该软件包同时提供了一个扩展库,它也是允许其他科学家依据自由软件精神 编制、发布软件的一个平台。EMBOSS 同时将现在可以得到的一系列序列分析 工具整合成一个无缝的整体。 使用者可以通过三种不同的方式使用 EMBOSS 软件:第一种是通过命令行 的方式;第二种是通过X-Windows 的方式使用EMBOSS 软件的图形界面;第三 种是内联网的方式。使用者可以免费获得以及这些软件以及相关界面程序。 通过前几节课的学习,我们已经学习了 water 、needle 、dottup、dotmatcher、 dotpath、polydot 、pepwheel 、pepnet 、tmap 等多种 EMBOSS 软件包中的工具, 下面就对这几个工具的使用作一个简要的总结。 首先 water 、needle 、dottup、dotmatcher、dotpath、polydot 属于序列排比分 析(Sequence Alignment)工具,上次已经做过总结,这次再简要谈一下。dotplot 是以点阵图来分析序列的相似性,能够在全局直观的反映两条或多条序列的相似 程度。needle 和 water 程序则是用来精确排比分析两条序列相似程度,计算得分、 一致性及相似性。在 dotplot 中,dottup 是两条序列精确匹配的作图方法,这个 程序的执行方式是在给定序列长度(word size) 下逐一比对,找到完全相同的序列 片段。而 dotmatcher 是两条序列近似匹配的作图方法,并不像 dottup 那样要求特 定长度的序列完全相同,它的执行方式是通过设定 threshold 来图示序列的相似 度,只要在给定的 window size 内,各碱基或氨基酸的配对得分高于设定的 threshold ,便可以在图示中表现出来。Dotpath 是 Non-overlapping wordmatch dotplot of two sequence,即两条序列不重叠的逐个匹配的作图方法。它与 dottup 类 似,但是排除了重叠的情况,序列不再进行重复的排比。最后一个 Polydot 则是 display all-against-all dotplots of a set of sequence,是一个多个序列比对的作图工 具。用它可以进行多个序列两两之间的排比分析。 needle 是用来寻找两条序列整体的最相似的区域 (global alignment) ;而water 则是用来寻找两段序列间最为匹配的区域(local alignment) 。needle 是将两条序 列从头到尾完全并列的分析,即使序列长度不一致,也会在两端补上大段的 gap, 并计算在得分和相似性之内;water 则只列出中间最相似的区域两条序列,其余 两端不匹配的片断略去不列出来,适合在较长的序列中找到相似性较高的片断。 Needle 、water 程序可以和 dotplot 结合起来使用,对于实验中获得的序列, 我们可以先用 dotplot 进行整体上的分析,找出相似区域,然后以 needle 或 water 进行进一步的排比分析。同时,dotplot 也可以比较 cDNA 和 genomic sequence, 用来判断 exon 在 genomic sequence 中的位置。 上节课学习的 tmap 、pepwheel 、pepnet 属于蛋白质二级结构分析工具,由于 在本地通过命令行方式运行程序不需要依赖网络条件,所以我在 Fedore core3 系 统下安装了 EMBOSS 软件包进行了练习。 tmap 用来查看该蛋白是否具有跨膜区,我用我们实验室做的 Ralstonia solanacearum

文档评论(0)

f8r9t5c + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档