- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
muthor分析atpd过程记录
Muthor分析atpD过程记录2012-11-22Mothur软件分析OTU或将序列归为不同的种类,可相似性来分(前半部分,第2到15张ppt),或按是否完全一样来分(最后的4张ppt)。1.用Mothur确定OTU也就是将序列相似性97%的定为一个OTU。如果按PlosOne上提出的三个基因的相似性为准,那么就能定出OTU了。如何在dos环境下运行mothur?(1)文件准备:将目标序列保存为fasta格式;(2)将mothur.exe与x.fasta放在同一文件目录下:(3)打开mothur,注意在英文输入法下打开mothur,否则会造成程序不响应。(4)调用dist.seqs指令,产生距离矩阵;输入完后按entercalc以不同方式处理gap:onegap指把所有把对偶排列中出现的所有连续缺失的碱基当做一个gap;nogap按实际缺失的碱基数对待;默认为onegap;countends:用以处理末端gap的罚分,=F,指对末端gap不罚分;=T指对末端gap进行罚分;cutoff:OTU的分界阈值Output:lt(指lowtriangle)或square,指输出距离矩阵为下三角还是矩形运行之后产生一个输出文件:注意文件格式:xxx.phylip.dist,该文件位于同一个目录下,见下页。生成的文件:atpD_Aligned-fasta.phylip.dist说明:与Mega5中形成的距离值类似。用记事本打开生成的文件:atpD_Aligned-fasta.phylip.dist,如下,为距离值(5)读入距离矩阵,用cluster进行OTU聚类(PS:mothur的早期版本此处要用read.dist先读入距离矩阵,最新版本将其与cluster指令整合在一起)Method有三种选择:回车,屏幕显示如下结果:(7)输出OTU的分类结果,用bin.seqs指令xxx.phylip.fn.0.01.fasta文件对应于序列相似为99%的OTU(cutoff=0.01);xxx.phylip.fn.0.03.fasta文件对应于序列相似为97%的OTU(cutoff=0.03)[这个上面的输出中没有,是举个例子,来自于原始的文件]用记事本打开atpD_Aligned-fasta.phylip.fn.unique文件,即可看出将每个序列归到不同的种类里去,即OTU。从中可看出,12个序列共有7个OTU。这与Mega5中聚树结果是一致的。给出独特的序列:7个OTU,99%相似性以上的:5个OUT,输出的文件见相应的名字。打开文件如下,将序列归类,与前面的一致,但是没有了序列,只有序列号名字。如果为unique,则表示某一个序列与其它的全一样,或全不一样。并将其中一个序列定为代表序列,如atpD_15644。或如下,有0.01,则将99%以上相似性的序列归到一起。并将其中一个序列定为代表序列,如atpD_15644。这张片子在我处理的数据中没有,因为没有低于97%的序列,因此没有出现这种情况。一篇博士论文中提到的Unique.seq也应与前面的原理一样。可以试着做一下。测试成功!见下面的片子!使用unique.seqs分析独特的序列类型在Mothur中输入:Unique.seqs(fasta=XXX.fasta),回车。即能计算出来。如我分析的atpD序列,共12个序列,产生7个独特的序列。并产生两个文件。两个文件的内容见下页。输入的命令产生的结果,12条序列,7个独特的序列产生的两个文件,打开后见下页。新生成的文件文件格式为xxx.names和xxx.unique.fas,如上图所示。打开文件第一个文件(上图)将序列归类,并给出代表菌株;第二个文件(下图)将代表序列给了出来。
文档评论(0)