- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
EMBOSS工具使用总结
EMBOSS 工具使用总结
EMBOSS 是The European Molecular Biology Open Software Suite的缩写,
是一个开放源代码的序列分析软件包,它是一组为分子生物学家所设计的公开且
免费软件。该软件能够自动识别处理以不同格式存储的数据,甚至可以通过互联
网提取数据,此外同软件包一同提供的还包括大量的程序库,软件包整合了 100
多个的序列分析程序,可以满足一般实验室的各种各样的序列分析要求。并且,
因为该软件包同时提供了一个扩展库,它也是允许其他科学家依据自由软件精神
编制、发布软件的一个平台。EMBOSS 同时将现在可以得到的一系列序列分析
工具整合成一个无缝的整体。
使用者可以通过三种不同的方式使用 EMBOSS 软件:第一种是通过命令行
的方式;第二种是通过X-Windows 的方式使用EMBOSS 软件的图形界面;第三
种是内联网的方式。使用者可以免费获得以及这些软件以及相关界面程序。
通过前几节课的学习,我们已经学习了 water 、needle 、dottup、dotmatcher、
dotpath、polydot 、pepwheel 、pepnet 、tmap 等多种 EMBOSS 软件包中的工具,
下面就对这几个工具的使用作一个简要的总结。
首先 water 、needle 、dottup、dotmatcher、dotpath、polydot 属于序列排比分
析(Sequence Alignment)工具,上次已经做过总结,这次再简要谈一下。dotplot
是以点阵图来分析序列的相似性,能够在全局直观的反映两条或多条序列的相似
程度。needle 和 water 程序则是用来精确排比分析两条序列相似程度,计算得分、
一致性及相似性。在 dotplot 中,dottup 是两条序列精确匹配的作图方法,这个
程序的执行方式是在给定序列长度(word size) 下逐一比对,找到完全相同的序列
片段。而 dotmatcher 是两条序列近似匹配的作图方法,并不像 dottup 那样要求特
定长度的序列完全相同,它的执行方式是通过设定 threshold 来图示序列的相似
度,只要在给定的 window size 内,各碱基或氨基酸的配对得分高于设定的
threshold ,便可以在图示中表现出来。Dotpath 是 Non-overlapping wordmatch
dotplot of two sequence,即两条序列不重叠的逐个匹配的作图方法。它与 dottup 类
似,但是排除了重叠的情况,序列不再进行重复的排比。最后一个 Polydot 则是
display all-against-all dotplots of a set of sequence,是一个多个序列比对的作图工
具。用它可以进行多个序列两两之间的排比分析。
needle 是用来寻找两条序列整体的最相似的区域 (global alignment) ;而water
则是用来寻找两段序列间最为匹配的区域(local alignment) 。needle 是将两条序
列从头到尾完全并列的分析,即使序列长度不一致,也会在两端补上大段的 gap,
并计算在得分和相似性之内;water 则只列出中间最相似的区域两条序列,其余
两端不匹配的片断略去不列出来,适合在较长的序列中找到相似性较高的片断。
Needle 、water 程序可以和 dotplot 结合起来使用,对于实验中获得的序列,
我们可以先用 dotplot 进行整体上的分析,找出相似区域,然后以 needle 或 water
进行进一步的排比分析。同时,dotplot 也可以比较 cDNA 和 genomic sequence,
用来判断 exon 在 genomic sequence 中的位置。
上节课学习的 tmap 、pepwheel 、pepnet 属于蛋白质二级结构分析工具,由于
在本地通过命令行方式运行程序不需要依赖网络条件,所以我在 Fedore core3 系
统下安装了 EMBOSS 软件包进行了练习。
tmap 用来查看该蛋白是否具有跨膜区,我用我们实验室做的 Ralstonia
solanacearum
您可能关注的文档
1亿VIP精品文档
相关文档
最近下载
- 脉冲电路中电阻功率的计算.pdf
- 有限空间作业管理制范本.pdf
- QC七大手法试题附答案.doc VIP
- GB∕T 33881-2017 罐车用铝合金板、带材.pdf
- 2024云南红河州个旧市城市发展集团限公司招聘工作人员2人高频考题难、易错点模拟试题(共500题)附带答案详解.docx
- EPC项目质量管理要点.pdf VIP
- 冀教版(三起)英语三年级下册Unit 4 Food and restaurants Lesson 19 I Like Fruit课件.pptx
- 《美术鉴赏》学业水平考试复习资料.docx VIP
- 体育与健康《田径--投掷》大单元教学计划(18课时).docx
- 小学五年级信息技术《设计环保标志——word插入形状,并在形状中填充图片》说课课件.pptx
文档评论(0)