上机实习四:BLAST序列相似性搜索工具的使用.pptVIP

 上机实习四:BLAST序列相似性搜索工具的使用.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
上机实习四: 基本局部比对搜索工具 blast的使用 * Step 1: Choose your sequence Sequence can be input in FASTA format or as accession number BLAST搜索的4个步骤 ①选择你所感兴趣的序列号或序列,将它粘贴到BLAST的输入框中。 ②选择一个BLAST程序(blastp,blastn,blastx,tblastx,tblastn)。 ③选择一个用于搜索的数据库。一个通常的选择是去冗余 (nr)。 ④为搜索和输出格式选择可选参数。 Example of the FASTA format for a BLAST query Step 2: Choose the BLAST program Step 2: Choose the BLAST program blastn (nucleotide BLAST) blastp (protein BLAST) tblastn (translated BLAST) blastx (translated BLAST) tblastx (translated BLAST) Step 3: choose the database nr = non-redundant (most general database) dbest = database of expressed sequence tags dbsts = database of sequence tag sites gss = genomic survey sequences htgs = high throughput genomic sequence Step 4a: Select optional search parameters CD search Step 4a: Select optional search parameters Entrez! Filter Scoring matrix Word size Expect organism BLAST: 选择参数 ? 选择搜索的物种 ? 选择过滤条件,过滤掉查询序列中具有较低复杂度的掩盖部分 ? 选择记分矩阵。对于blastp有5种矩阵:PAM30,PAM70, BLOSUM45,BLOSUM62 (默认值)以及BLOSUM80。 ? 期望值的默认设定值是10。在这个E值下,随机出现得分等于或高于比对得分S的期望数为10个。当将期望选项值调小时,返回的数据库搜索结果将变少;匹配被搜索到的概率也会变小。增大E值将返回更多的结果? 字段长度。 默认值 BLASTp为3,BLASTn为11 ? 返回结果的格式 filtering Step 4b: optional formatting parameters Alignment view Descriptions Alignments taxonomy database query program taxonomy High scores low e values Cut-off: .05? 10-10? We will get to the bottom of a BLAST search in a few minutes… threshold score = 11 EVD parameters BLOSUM matrix Effective search space = mn = length of query x db length 10.0 is the E value gap penalties cut-off parameters General concepts How to evaluate the significance of your results How to handle too many results How to handle too few results BLAST search strategies Sometimes a real match has an E value 1 …try a reciprocal BLAST to confirm Sometimes a similar E value occurs for a short exact match and long less exact match Assessing whether proteins are homologous RBP4 and PAEP: Low bit score, E value 0.49, 24% identity (“twilight zone”). But they

文档评论(0)

guanpiea + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档