基因家族分析套路.docx

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因家族分析套路

基因家族分析套路(一)近年来,测序价格的下降,导致越来越多的基因组完成了测序,在数据库中形成了大量的可用资源。如何利用这些资源呢?今天小编带你认识一下不测序也能发文章的思路--全基因组基因家族成员鉴定与分析(现在这一领域可是很热奥);一、基本分析内容数据库检索与成员鉴定进化树构建保守domain和motif分析.基因结构分析.转录组或荧光定量表达分析.二、数据库检索与成员鉴定1、数据库检索1)首先了解数据库用法,学会下载你要分析物种的基因组相关数据。一般也就是下面这些数据库了Brachypodiumdb:/TAIR:/Rice?Genome?Annotation?Project?:/.Phytozome:/Ensemble:/genome_browser/index.html?NCBI基因组数据库:/assembly/?term=2)已鉴定的家族成员获取。? ? ??如何获得其他物种已发表某个基因家族的所有成员呢,最简单的就是下载该物种蛋白序列文件(可以从上述数据库中下载),然后按照文章中的ID,找到对应成员。对于没有全基因组鉴定的,可以下列数据库中找:???a.?NCBI:?nucleotide?and?protein?db.?????b.?EBI:?http://www.ebi.ac.uk/.?????c.?UniProtKB:/uniprot/2、比对工具。一般使用blast和hmmer,具体使用命令如下:Local?BLASTformatdb–i?db.fas–p?F/T;blastall–p?blastp(orelse)?–i?known.fas–d?db.fas–m?8?–b?2(or?else)?e?1e-5?–o?alignresult.txt.-b:output?two?different?members?in?subject?sequences?(db).Hmmer?(hidden?Markov?Model)?search.?Thesame?as?PSI-BLAST?in?function.?It?has?a?higher?sensitivity,?but?the?speed?islower.Command:hmmbuild--informatafaknown.hmmalignknown.fa;??hmmsearchknown.hmmdb.fasalign.out.3、过滤。Identity:?至少50%.Cover?region:?也要超过50%或者蛋白结构域的长度.domain:?必须要有完整的该蛋白家族的。工具pfamdb?(http://pfam.sanger.ac.uk/)?和NCBI?Batch?CD-?search.?(/Structure/bwrpsb/bwrpsb.cgi).EST?支持?Blast?and?Hmmer同时检测到4、通过上述操作获得某家族的所有成员基因家族分析套路(二)本次主要讲解在基因家族分析类文章中,进化部分分析的内容。主要是进化树的构建与分析。一、构建进化树的基本步骤1、多序列比对.?Muscle?program.2、Model?选择.?分别针对蛋白序列和核酸序列的模型选择程序。ProtTest?program?for?protein?and?ModelTest?or?Jmodetlest?for?DNA(blog).3、算法选择。三种.?NJ,?ML?and?BI.4、软件选择。?MEGA?(bootstrap?least?1000?replicates),?phyML?and?Mrbayes?(main).5、进化树修饰.?MEGA:?view-options?and?subtree-?draw?options.?Also?can?be?decorated?in?word?(main)二、具体步骤?2.1?多序列比对。一般采用muscle。因为?MUSCLE?is?one?of?the?best-performing?multiple?alignment?programs?according?to?published?benchmark?tests,?with?accuracy?and?speed?that?are?consistently?better?than?CLUSTALW.2.2?模型选择。对于用蛋白序列构建进化树的可以采用下面命令:???java??-Xmx250m??-classpath??path/ProtTest.jar??prottest.ProtTest??-i?alignmfile.phy.运行结果如下图?注意:1)“.Phy”?format.?Only?allow?ten?cha

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档