- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Clustalx 实验指南(一步一步很详细)
实验三:多条序列比对——Clustalx
(一)ClustalX
Clustal是一种利用渐近法(progressive alignment)进行多条序列比对的软件。即从多条序列中最相似(距离最近)的两条序列开始比对,按照各个序列在进化树上的位置,由近及远的将其它序列依次加入到最终的比对结果。(Figure 3.1)
HYPERLINK / /
安装clustalx程序。
双击安装clustalx-2.0.12-win.msi.exe文件到自己的电脑上。
也可从 HYPERLINK /download/current/ /download/current/下载,列表中的倒数第二个文件。 HYPERLINK /download/current/clustalx-2.0.10-win.msi clustalx-2.0.12-win.msi
Figure 3.1 clustal 算法
准备要比对的序列
请查找至少存在于5个物种中的同源序列(核酸或蛋白质皆可),并保存为fasta格式,存为文本文件(所有的序列请粘贴到同一个文本文件中)。选择NM、XM或NP打头的序列,不要选择NC或NW打头的序列,那是全基因组序列。
做法可参照邮箱中的preparations for practice3.doc文件。
打开clustalX程序
开始菜单-程序-clustalX2- clustalX2
载入序列
点最上方的File菜单,选择Load Sequence-选择你刚保存的序列文件,点打开。
在左侧窗口里是fasta格式序列的标识号,取自序列第一行“”后的字符。(Figure 3.2)
注意:ClustalX程序无法识别汉字,无法识别带空位的文件夹名,如 my document。各位同学保存的序列文件不要保存在桌面上或带汉字的文件夹中,推荐保存在D盘根目录下。
常见文件打开错误原因:
序列格式有问题,非正确的fasta格式。
文件中有序列重复粘贴。
TIPS: 想要方便识别序列所属物种,可在每条序列“”后输入物种名,加空位即可。
EXAMPLE:原格式:gi|262050536|ref|NM_002218.4| Homo sapiens inter-alpha (globulin) inhibitor H4 (plasma Kallikrein-sensitive glycoprotein) (ITIH4), transcript variant 1, mRNA
改为:human gi|262050536|ref|NM_002218.4| Homo sapiens inter-alpha (globulin) inhibitor H4 (plasma Kallikrein-sensitive glycoprotein) (ITIH4), transcript variant 1, mRNA
Figure 3.2 载入序列
比对参数的选择
可以对两条序列比对的参数和多条序列比对的参数进行设置。
两条序列比对的参数设置
点击Alilgnment菜单,选择Alignment Parameters,再选择Pairwise Alignment Parameters,得到Figure 3.3.首先可以选择比对的效果,是slow/accurate 还是fast/approximate。第一种模式采用的是动态规划算法进行比对的,第二种模式采用的是启发式的算法。除非序列非常长,一般采用第一种模式。可以选择空位罚分系统,要使用的DNA或蛋白质替换矩阵,也可以自己上传某个替换矩阵进行比对。
Figure 3.3 Pairwise Alignment Parameters
多条序列比对参数设置
点击Alilgnment菜单,选择Alignment Parameters,再选择Multiple Alignment Parameters,得到Figure 3.4.
Figure 3.4 Multiple Alignment Parameters
Delay divergent sequence是指当两条序列的差异大于某个值(百分比)的时候,这两条序列的比对将推迟进行,它们的比对结果会在最后加入到最终的多条序列比对结果。DNA transition Weight等于0的时候,程序将转换(transition)当作错配(mismatch)看待,等于1的时候,将转换(transition)当作颠换(transversion)看待。当参与比对的序列差异较大时,DNA transition Weight应该选择的小些(接近0),如果参与比对的序列差异较小时,DNA transition Weight可选择的大些(接近1)。
更改输出格式
点击Alignment菜单,选择Outpu
文档评论(0)