第三章BLAST原理及方法.pptVIP

  1. 1、本文档共95页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Step 4a: 选择可选的搜索参数 Select optional search parameters Entrez! Expect Word size Scoring matrix Filter BLAST: optional parameters You can... ? choose the organism to search ? turn filtering on/off ? change the substitution matrix ? change the expect (e) value ? change the word size ? change the output format Step 4b: 选择可选格式参数 optional formatting parameters BLAST 搜索有很多控制输出格式的参数: ? Alignment view ? Descriptions ? Alignments Step 4b: 选择可选格式参数 optional formatting parameters BLAST 搜索结果的顶部 ? 顶部提供关于该搜索的详细信息 :BLAST 搜索的类型、关于查询内容和所搜索的数据 库的描述以及一个分类连接可以将结果按照 物种进行分类。 query 结果网页 database program taxonomy taxonomy Step 4b: 选择可选格式参数 optional formatting parameters BLAST 搜索结果的中间部分 ? 显示的是数据库中序列与查询序列相匹配的项的列表。 ? 简明图形提供了用不同颜色表示的搜索结果的概况。图下 面的每一个条带表示数据库中的一个与查询序列相匹配的蛋 白质或核酸序列,被标以不同颜色表示亲缘关系的远近 ( 根据 比对的分 ) ,最接近匹配用红色表示。每条线的长度对应于该 序列与查询序列比对上的区域大小。 ? 所有比对用一个被称为“描述”的单行小结列表描述。按 照 E 值增加的顺序排列。显著性最强的匹配将位于顶端。 ? 结果的 图示输出 ? 数据库 序列的列 表 High scores low e values Step 4b: 选择可选格式参数 optional formatting parameters BLAST 搜索结果的靠下面部分 ? 显示的是一系列的两两序列比对 ? 可检查查询序列(输入序列)与对象序列(如和 查询序列比对的的特定的数据库匹配)之间的比对情 况。 ? 4 种衡量的分数:比特分数、期望分数、一致性百 分比、正性 ( 相似性百分比 ) Step 4b: 选择可选格式参数 optional formatting parameters 可以不用整体地进行 BLAST 搜索而仅通过改变格式 选项来提供一些不同的输出结果 ? 一些选项可以把比对序列显示成多序列比对的形式 ,这对于确定一个蛋白质或 DNA 家族中的保守的或 趋异的氨基酸残基非常有用。 ? BLAST format options BLAST format options Step 3: choose the database BLAST 搜索可使用的数据库会列在每一个 BLAST 页面上,对于蛋白质数据库搜索 (blastp 和 blastx) , 两个主要的选择即 nr 数据库和 SwissProt 。 nr = non-redundant (most general database) dbest = database of expressed sequence tags dbsts = database of sequence tag sites gss = genomic survey sequences htgs = high throughput genomic sequence Step 3: choose the database nr 数据库是合并了若干个主要的蛋白质或 DNA 数据 库得到的。这些数据库中经常包含有相同的序列, 但 nr 数据库只收录其中的一个序列 ( 即使在 nr 数据库 中出现看上去一样的序列,实际上还是具有一些细 节上的区别 ) 。 nr 数据库是在要搜索现有的绝大多 数序列时典型和常用的数据库。 去冗余 GenBank 编码序列 PDB + SwissProt + PIR + PRF Step 4a: 选择可选的搜索参数 Select optional search parameters 当确定了要输入的序列和要搜索的数据库之后,还 有 10 个其他的可选参数要确定。 ① Limit by Entrez Query :任何 NCBI

文档评论(0)

capt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档