重复基因的进化.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重复基因的进化

重复基因的进化 数据下载 用这457对啤酒酵母的重复基因,搜寻几个近缘物种以及3个未经历过全基因组重复的外群物种的直系同源基因。/regev/orthogroups/orthologs.html。 数据整理 把在5个经历过全基因重复的近缘物种中缺失的基因数多于2个基因的组删除,把在3个外群中多拷贝的物种数为2或者3的组删除。这样经过筛选以后在原有的457组中筛选出366组进行进一步分析。 用system函数在LinuxCS下把各个物种对应的序列一次性提取出来,/regev/orthogroups/sources.html。由于以后要对其功能进行研究,所以提取出来的AA和NUC序列都必须是一个完整的基因。于是将不是以ATG开头或不是以终止密码子结尾的序列删除,剩下333组进入下一步。 将各组的氨基酸序列对齐(Clustal),再将生成的aln文件和对应的NUC文件用PAL2NALserver http://coot.embl.de/pal2nal/对齐。或者下载一个本地的perl程序,用system函数调用外部命令。直接在输出格式里进行设置以得到我想要的PAML格式(no gaps),PAML格式(with gaps),Clustal格式(使用PAUP*的时候需要)的输出文件。 参数估计(PAML) 首先将Clustal格式的文件用Clustal转换为nex格式。用PAUP*生成各组序列相应的拓扑结构。并用#进行标记。 最终将符合上述拓扑结构的组保留下来(231组,包含修正后的数据),使用PAML软件包里的codeml程序进行两个paralogy clades的omega参数估计。 对231组数据的结果进行统计发现结果不太正常,omega值常出现999(正无穷)的情况,也就意味着在该进化枝上没有同义替换的发生。 * 技术路线 数据下载 数据整理 参数估计(PAML) 基因功能分析 Manolis Kellis在2004年的一篇名为Proof and evolutionary analysis of ancient genome duplication in the yeast Saccharomyces cerevisiae的文章中就表明在啤酒酵母中有457个基因对起源于WGD。 $less name | perl –ne’chomp;my $a=$_;system(“perl getseq4name.pl all8species.txt $_ $_seq.txt”)’ seqfile = 61-nogapout.txt treefile = tree-61.txt outfile = testout-61-1.txt noisy = 3 * 0,1,2,3,9: how much rubbish on the screen verbose = 1 * 1: detailed output, 0: concise output runmode = 0 * 0: user tree; 1: semi-automatic; 2: automatic * 3: StepwiseAddition; (4,5):PerturbationNNI seqtype = 1 * 1:codons; 2:AAs; 3:codons--AAs CodonFreq = 2 * 0:1/61 each, 1:F1X4, 2:F3X4, 3:codon table clock = 0 * 0: no clock, unrooted tree, 1: clock, rooted tree model = 2 * models for codons: * 0:one, 1:b, 2:2 or more dN/dS ratios for branches NSsites = 0 * dN/dS among sites. 0:no variation, 1:neutral, 2:positive icode = 0 * 0:standard genetic code; 1:mammalian mt; 2-10:see below fix_kappa = 0 * 1: kappa fixed, 0: kappa to be estimated kappa = 2 * initial or fixed kapp

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档