- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高级BLAST
* /66 * /66 /wiley/chapter5/Webdocument_5-16_findagene_globin.htm * /66 具体比对 * /66 201310具体比对 网站具体比对数据 Pattern examples PA [AC]-x-V-x(4)-{ED}. This pattern is translated as: [Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp} PA A-x-[ST](2)-x(0,1)-V. This pattern, which must be in the N-terminal of the sequence (), is translated as: Ala-any-[Ser or Thr]-[Ser or Thr]-(any or none)-Val * /66 多序列比对构建Pattern * /66 用人rbp4序列(NP_006735)在细菌数据库搜索,与获得的结果进行多序列比对,在多序列比对基础上参考残基理化性质构建pattern。 用NP_006735在细菌( bacteria )蛋白中搜索结果。 * /66 PHI-BLAST GXW[YF][EA][IVLM] bacteria * /66 * /66 * /66 再运行PSI-BLAST,就能成功地找到一大家族的细菌lipocalin蛋白质。 * /66 201310结果 用NP_006735在细菌( bacteria )蛋白中搜索结果。 非模式搜索。 * /66 201310结果 GXW[YF][EA][IVLM] 用NP_006735在细菌( bacteria )蛋白中搜索结果。 * /66 四、发现新基因 所谓发现新基因是指在数据库中发现的一些还没有被注释的DNA序列。例如会为下面这些理由去寻找新基因。 ①可能会在一个感兴趣的特殊物种中(如植物或者古细菌)想研究一个以前从未发现过的lipocalin。 ②想知道是否细菌也有lipocalin蛋白质。如果这样,就可以深入了解这个转运蛋白质家族的进化 ③正在研究HIV pol蛋白质,尤其是它的逆转录酶区域。你想在真核生物蛋白质中找到这个区域的例子,但不想研究一个已知有这个motif的真核生物蛋白质,而更愿意去研究一个从来没有描述过的新蛋白质。 * /66 常用方法 从一个已知序列的蛋白质开始 搜索一个DNA数据库(例如HTGS,GSS,dbEST,或者一个特定物种的基因组序列) 用你新发现的DNA或者蛋白质搜索一个蛋白质数据库(如,非冗余数据库)来证实你确实发现了一个新的基因或者蛋白质。 寻找下列匹配: (1)与已知蛋白质的DNA序列匹配 (2)与相关蛋白质的DNA序列匹配 (3)非显著性的匹配 步骤1:tblasn比对 步骤2:检查结果 步骤3:进行blastx nr或者balstp nr 比对 * /66 发现新基因 * /66 * /66 NP_290784(大肠杆菌lipocalin蛋白) * /66 giref|NP_290784.1| outer membrane lipoprotein Blc [Escherichia coli O157:H7 EDL933] MRLLPLVAAATAAFLVVACSSPTPPRGVTVVNNFDAKRYLGTWYEIARFDHRFERGLEKVTATYSLRDDG GLNVINKGYNPDRGMWQQSEGKAYFTGAPTRAALKVSFFGPFYGGYNVIALDREYRHALVCGPDRDYLWI LSRTPTISDEVKQEMLAVATREGFDVSKFIWVQQPGS * /66 * /66 挑选候选“基因” * /66 获得候选蛋白质序列 GVHAVKPFYPEKYVGKWYEIARLYTYFEKDLDKITAEYSINKDGSITVVNSGYNYKKKKRENAKGIAYFVNGSDEGMLKVSFFGPFYSGYNVIAIDPDYKYALIAGQSFDYMWILSKEPTIPEKIKNSYLELAKSVGYDITKLIWSKQ Dictyostelium discoideum AX4 * /66 在nr数据库BLAST检验 * /66 把新获得的候选“基因”在nr数据库中搜索,如果能找到完全相同的序列,则表示该段dna已经被注释了,反之,则可能是一个“新基因”。 其中一个结果 Aplysia californica * /66 * /66 SPPPPFCLCCLTYFTLITLPPPSPLPPPLQYLGTWYEYERFDNWFEAGMDCVRAEYGLNPDQTISVLNAG QYLGT
文档评论(0)