重复基因的进化.pptVIP

下载本文档

40
0
约4.89千字
约 12页
2017-07-22 发布于浙江
举报
版权申诉

重复基因的进化.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

重复基因的进化

重复基因的进化数据下载用这457对啤酒酵母的重复基因，搜寻几个近缘物种以及3个未经历过全基因组重复的外群物种的直系同源基因。/regev/orthogroups/orthologs.html。数据整理把在5个经历过全基因重复的近缘物种中缺失的基因数多于2个基因的组删除，把在3个外群中多拷贝的物种数为2或者3的组删除。这样经过筛选以后在原有的457组中筛选出366组进行进一步分析。用system函数在LinuxCS下把各个物种对应的序列一次性提取出来，/regev/orthogroups/sources.html。由于以后要对其功能进行研究，所以提取出来的AA和ＮＵＣ序列都必须是一个完整的基因。于是将不是以ＡＴＧ开头或不是以终止密码子结尾的序列删除，剩下３３３组进入下一步。将各组的氨基酸序列对齐（Ｃｌｕｓｔａｌ），再将生成的aln文件和对应的ＮＵＣ文件用ＰＡＬ２ＮＡＬserver http://coot.embl.de/pal2nal/对齐。或者下载一个本地的perl程序，用system函数调用外部命令。直接在输出格式里进行设置以得到我想要的PAML格式（no gaps）,PAML格式（with gaps）,Clustal格式(使用ＰＡＵＰ*的时候需要)的输出文件。参数估计（PAML）首先将Clustal格式的文件用Clustal转换为nex格式。用PAUP*生成各组序列相应的拓扑结构。并用#进行标记。最终将符合上述拓扑结构的组保留下来（231组，包含修正后的数据），使用PAML软件包里的codeml程序进行两个paralogy clades的omega参数估计。对231组数据的结果进行统计发现结果不太正常，omega值常出现999（正无穷）的情况，也就意味着在该进化枝上没有同义替换的发生。 * 技术路线数据下载数据整理参数估计（PAML）基因功能分析 Manolis Kellis在2004年的一篇名为Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae的文章中就表明在啤酒酵母中有457个基因对起源于WGD。 $less name | perl –ne’chomp;my $a=$_;system(“perl getseq4name.pl all8species.txt $_ $_seq.txt”)’ seqfile = 61-nogapout.txt treefile = tree-61.txt outfile = testout-61-1.txt noisy = 3 * 0,1,2,3,9: how much rubbish on the screen verbose = 1 * 1: detailed output, 0: concise output runmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons--AAs CodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table clock = 0 * 0: no clock, unrooted tree, 1: clock, rooted tree model = 2 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branches NSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positive icode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see below fix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimated kappa = 2 * initial or fixed kapp