生物信息学-NCBI数据库(1).ppt

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.结果总览 红、粉、绿、蓝、黑五种颜色,红色同源性最高,排在最上面,其他依次降低,黑色最低。每一条线代表搜索匹配的一条序列; 2.比对结果描述 与目标序列同源性最高的结果在最上面,E值最低,score最大,点击序列号可以查看详细信息。点击score可以打开对应的比对详细信息。 转录产物序列 基因序列 匹配序列表 带有genbank的链接,点击可以进入相应的genbank序列 目标序列描述部分 匹配情况,分值,e值 Blast程序评价序列相似性的两个数据 Score:使用打分矩阵对匹配的片段进行打分,这是对各对氨基酸残基(或碱基)打分求和的结果,一般来说,匹配片段越长、 相似性越高则Score值越大。 E value:在相同长度的情况下,两个氨基酸残基(或碱基)随机排列的序列进行打分,得到上述Score值的概率的大小。E值越小表示随机情况下得到该Score值的可能性越低。 3、各序列比对详情 因申请者提交的要求不同,行列输出有不同的形式,系统默认的是配对行列输出,即查询序列与数据库中匹配的序列垂直对应。空位部分代表查询序列与检索匹配序列不一致。 双序列比对 Blast比对后,当在数据库中搜索到多个显著相似的序列时,目的序列是否与数据库中检索到的序列真正有关联,这时就需要进行双序列比对(pairwise alignment)。 通过双序列比对分析,可以找出两序列之间的最大相似性匹配,进而判断两者是否具有同源性。 Blast主页 双序列比对 Thank you and questions 调课通知 第11周 周五 5、6节 调到 13周周五7、8节 6舍411 第12周 周三1、2节 调到 13周 周三3、4节 6舍411 * * * Nucleotide and genome Nucleotide 该数据库由国际核苷酸序列数据库成员美国国立卫生研究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。 这三个组织联合组成国际核苷酸序列数据库协作体,每天交换各自数据库中的新增序列记录实现数据共享。 其中的核酸序列数据也通过与基因组序列数据库(GSDB)合作获取。 选择数据库 输入关键字 NCBI主页 进入Entrez检索 Entrez简介 Entrez是个全局的生物医学搜索引擎,他可以检索的数据库主要包括三类: (1) 文献数据库:PubMed,PubMed Central, Journals,Books,OMIM,OMIA。 (2) 序列数据库:Nucleotide,Protein,Genome, Strcture,SNP。 (3) 其他数据库:Taxonomy,Gene, Probe,PopSet等 无对应结果 相关的结果 Entrez检索的结果 Entrez 功能强大,在于它的大多数记录可相互链接,既可 在同一数据库内链接,也可在数据库之间进行链接。 Entrez browser来查询各种数据(集成搜索工具) 基因组的相关的信息 查看详细结果 详细结果 序列部分 注释部分 下载格式选择 注释部分 基因位点(Locus)、基因定义(Definition)、基因存取号(Accession)、关键词(Keywords)、 来源(Source)、组织分类(Organism)、参考文献(Reference)、 著者(Author)、题目(Title)、期刊(Journal)、序列特征(Features)、基因(Gene)、蛋白质编码序列CDS(cDNA) 、5’非翻译区(5’UTR)、 3’非翻译区3’UTR)、mRNA的polyA位置(polyA_site)、信使RNA( mRNA )、外显子( exon )、内含子( intron )、原序列(Origin)。 常用序列格式:FASTA格式 1.定义: 在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来编码,且允许序列前添加序列名及注释。通常核苷酸符号大小写均可,而氨基酸常用大写字母。 2

文档评论(0)

喵咪147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档