序列分析和BLAST.docVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
序列分析和BLAST.doc

实验一: 利用uniprot数据库查看当前蛋白质数据库都包含哪些信息。 下面是一个蛋白质的例子(/uniprot/P10962) 进入ncbi网站:/。NCBI是生物技术信息中心,请先了解一下它的各项资源。 实验二: 病毒逆转录酶(如HIV-1的pol)具有人类同源物。将HIV-1的pol蛋白(NCBI refseq号:NP_057849)和人类的pol多聚蛋白(uniprotKB号:P10266)做BLAST 2 Sequences 双序列比对。 试着改变打分矩阵,看看结果的变化。Blosum矩阵和PAM的结果有什么不同? 提示:1,由NCBI主页进入BLAST(点击BLAST): 2, 然后选择Protein BLAST: 点击Align two or more sequences: 最后界面为: 在两个输入框分别输入蛋白质序列或对应蛋白质的数据库编号(此例中为NP_057849和P10266),然后点击按钮。 实验三: 用retinol-binding protein 4(RBP4)蛋白质为例子来观察DNA比对和蛋白质比对的差异。用RBP4蛋白质序列(NCBI refseq号:NP_006735)和DNA编码序列(NCBI refseq号:NM_006744)分别作blastp和blastn,将物种限制为昆虫(Arthropoda)。哪一个检索返回更多的满足阈值的匹配(期望值E设为1)?找出一个RBP4的同源基因,然后跟RBP4分别做蛋白质和核酸双序列比对,观察DNA比对和蛋白质比对的差异。 实验四: 多结构域蛋白质的BLAST检索。 retinol-binding protein 4(RBP4)是单结构域蛋白质,而病毒逆转录酶(如HIV-1 pol)是多结构域蛋白质。这两个蛋白质分别做BLAST检索,仔细观察结果有什么不同?为防止返回结果太多,可以减少搜索范围,比如小鼠(mouse)或细菌。 实验五: 利用人类RBP4蛋白质为例子了解PSI-BLAST和BLASTP的流程,该蛋白质编号为NP_006735。看看第一次的PSI-BLAST的循环所返回的结果和BLASTP是不是相同。注意每次BLAST的结果都可以保存,其中PSI-BLAST循环所产生的PSSM矩阵也可以保存。 了解基本流程后,可以做下面实验:寄生虫Plasmodium vivax有一个多基因家族vir为其所特有。这些基因有600~1000个拷贝,他们可能会通过抗原变异导致慢性感染。选择vir1在非冗余数据库中blastp搜索,然后用同样的输入进行PSI-BLAST搜索。 在最初的搜索中,大约有多少个蛋白质的E值小于0.002,多少大于0.002? PSI-BLAST搜索第一轮和第二轮循环之间增加的最好的新序列的分值是多少? ACCESSION: CAB96690 实验六: 以人类视黄醇结合蛋白为例学习PHI-BLAST搜索。请选择PHI-BLAST,输入NP_006735进行搜索,第一次先不要输入PHI模式。然后再做第二次PHI-BLAST搜索,这次在输入框中加入下列模式:GXW[YF][EA][IVLM]。仔细观擦两次返回的结果有什么不同。 PHI-BLAST的返回结果能不能作为PSI-BLAST的输入?这样做有什么好处? 实验七: 1. 创造一个人工蛋白质序列,包含两个不同的结构域。将这个联合序列进行BLAST搜索和PSI-BLAST搜索。自然界存在同时含有你选择的两个结构域的蛋白质吗? PSI-BLAST在搜索多结构域蛋白质时,表现如何? 请选择下面的结构域对做实验: PF02310和PF04055,或者PF01535 和PF07654,或者PF01363和PF00169。它们代表Pfam数据库的结构域,可以去该数据库获取它们的某个蛋白质序列。 2. 挑选一个多结构域蛋白质,如HIV-1 pol(NP_057849),利用它来做BLAST和利用它的某一个结构域做blast有什么不同?PSI-BLAST搜索中又有什么不同? 作为例子,你也可以选择芽胞杆菌的内切壳多糖酶(A0A1H0),它也是一个多结构域蛋白质。 下面的蛋白质都可以作为例子来搜索: A0CRI7 B6QX46 A0CRN1 A4FYD0 Q4VAN1 O93120 Q4WPG2 P08315 C8LBR7 P13605 作业 测试对NCBI的了解。你想研究一个基因,你想确定它在哪些组织中表达,下面那个资源可以帮你最直接地获取这类信息?如果你需要文献信息,下面哪个数据库是你最佳的访问站点?如果你需要蛋白质结构信息,下面哪个数据库是你最佳的访问站点? 从以下选项中选择: Unigene;Entrez;LocusLink;OMIM; Taxonomy;PDB;Pubmed Lipo

文档评论(0)

xingkongwd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档