05_1技术解说.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
在真核生物和古细菌的转录启动子上,有一个特殊的DNA片段,叫做TATA box. 这段序列通常是 5‘-TATAAT-3’ 或者略有变化。TATA box是RNA聚合酶的结合位点。利用Weblogo,可以快速、直观地找到这一结合位点的位置。 序列标识图: WebLogo 寻找保守区域 在核酸/蛋白质序列中存在有特定模式的序列片段,这些片段称为序列基序。序列基序与生物功能密切相关。 例如,N-糖基化位点基序(N-glycosylation site motif)总是符合以下特定模式:以Asn开始, 然后紧跟除了Pro之外的任何一个氨基酸,再紧跟Ser或者Thr,再紧跟除Pro外的任何一个氨基酸。 这个特定模式可通过正则表达式(Regular expression)来表述: N{P}[ST]{P} 其中 N=Asn, P=Pro, S=Ser, T=Thr; {X}代表除X外的任意氨基酸; [XY]代表X或者Y。 序列基序(sequence motif) 寻找保守区域 一款可以自动从一组相关的DNA或蛋白质序列中发现序列基序的软件: 序列基序:MEME /meme/intro.html 寻找保守区域 meme.seqs 序列基序:MEME /meme/intro.html 寻找保守区域 序列基序:MEME /meme/intro.html 寻找保守区域 * 生物信息学 第五讲:序列比较 II 2013.3.27 数据库中的序列相似性搜索 在麻将连连看中,你需要用眼睛从一推麻将牌中找出一对相同的麻将牌。 序列相似性搜索 数据库中的序列相似性搜索 对于一个蛋白质或DNA序列,你需要从序列数据库中找到与它相同或相似的序列。不可能再用眼睛去比较每一对序列,因为数据库中有太多序列,甚至用眼睛比较一对序列都是不可能做到的。 …… 100,000 BLAST 序列相似性搜索 BLAST (Basic Local Alignment Search Tool,基本局部比对搜索工具) 是目前最常用的数据库搜索程序。国际上各著名的生物信息数据库网站都提供基于web的BLAST在线服务。 BLAST基本原理很简单,它的要点是片段对的概念。所谓片段对是指两个给定序列中的一对子序列,它们的长度相等,且可以形成无空位的完全匹配。 KSD FGETS IV ATGG STE ||||| |||| NE FGETS LI ATGG NPA BLAST首先找出探测序列和目标序列间所有的匹配程度超过一定阈值的序列片段对,然后对片段对根据给定的相似性阈值进行延伸,得到一定长度的相似性片段,最后给出高分值片段对(high-scoring pairs, HSPs)。改进后的BLAST允许空位的插入。 K SD FGETS IV ATGG S TE :: ||||| :: |||| : NE FGETS LI ATGG N PA 高分值片段对 BLAST 搜索 BLAST实际上是综合在一起的一组程序的统称,它不仅可用于直接对蛋白质序列数据库和核酸序列数据库进行搜索,而且可以将探测序列翻译成蛋白质后再进行搜索,或反之,以提高搜索效率。 blastp:用蛋白质探测序列搜索蛋白质序列数据库 blastn:用核酸探测序列搜索核酸序列数据库 blastx:将核酸序列按6条链翻译成蛋白质序列后搜索蛋白质序列数据库 tblastn:用蛋白质探测序列搜多核酸序列数据库,核酸序列按6条链翻译成 蛋白质。 tblastx:将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6 条链翻译成的蛋白质序列的数据库。 BLAST 搜索 The NCBI BLAST server / BLAST 搜索 The NCBI BLAST server: BLASTp BLAST 搜索 探测序列:blast.fasta The NCBI BLAST server: BLASTp BLAST 搜索 只搜索序列的一部分 给搜索任务起个名 同时BLAST多条序列 The NCBI BLAST server: BLASTp BLAST 搜索 探测序列:blast.fasta 选择备搜的数据库 The NCBI

文档评论(0)

5201394 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档