NCBI站点的一般-教育部网上合作研究项目首页概述.ppt

NCBI站点的一般-教育部网上合作研究项目首页概述.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NCBI站点的一般介绍及其它资源库的介绍 GenBank Overview 生物信息学站点地图 其它资源库的介绍 国际核苷酸序列数据库合作组织 ? GenBank由位于马里兰州Bethesda的美国国立卫生研究院下属国立生物技术信息中心建立,与日本DNA数据库(DNA Data Bank of Japan ,DDBJ)以及欧洲生物信息研究所的欧洲分子生物学实验室核苷酸数据库( European Molecular Biology Laboratory, EMBL) 一起,都是国际核苷酸序列数据库合作的成员。 GenBank,DDBJ,and EMBL,所有这3个中心都可以独立地接受数据提交,而3个中心之间则逐日交换信息,并制成相同的充分详细的数据库向公众开放。因此他们是相等的。 什么是GenBank? GenBank是美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸序列。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。 每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。 这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成DNA序列数据库的直接提交。这些作者将序列数据库作为论文的一部分来发表,或将数据库直接公开。 GenBank GenBank是一个有13亿碱基,来自于100,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。 ?遗传密码 - 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。 访问GenBank 通过Entrez Nucleotides来查询。 用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。 关于Entrez更多的信息请看下文。 用BLAST来在GenBank和其他数据库中进行序列相似搜索。 用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。 纪录样本 每个记录代表了一个单独的、连续的、带有注释的DNA或RNA片段。 这些文件按类别分为几组:有些按照系统发生学划分,另外一些则按照生成DNA序列数据库的直接提交。这些作者将序列数据库作为论文的一部分来发表,或将数据库直接公开。 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。 ? DDBJ/EMBJ/GenBank特性表 (见讲义或网络课件) 特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。 数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。 GenBank普通文件格式 参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。 ?ASN.1格式 — 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。 ?分子数据库概览 核酸序列 ?Entrez核酸 — 用accession number,作者姓名,物种,基因/蛋白名字,以及很多其它的文本术语来搜索核酸序列记录(在GenBank + PDB中)。更多的关于Entrez的信息见下。如果要检索大量数据,也可使用Batch Entrez(批量Entrez)。 ? ?Entrez基因组 提供了一个编码区的概要和各种物种的分类表(TaxTable)。 编码区概要列出了在基因组中所有的的蛋白,并提供链接到FASTA文件和BLAST。 分类表总结了蛋白BLAST分析的结果,建议他们的可能功能,并用颜色编码的图来显示物种同其它物种之间的关系 。? BLAST 将你的序列同核酸库中的的序列比较,检索相似的序列。(更详细的信息见下面Tools/Sequence相似搜索部分) ? BLAST 查找 BLAST指南 BLAST 程序对数据库搜索进行大量的改良,提高了搜索速度,同时把数据库搜索建立在了严格的统计学基础上。 局部比对的限制条件不包括空位。这个限制条件对应用Karlin—Altschul统计学极为有利,另一方面,既然空位没有明确地放在模型中,结果就不会像人们期望的那样接近于期望的比对。这并不是说插入确实会妨碍匹配,在大多数情况下,比对仅仅会

文档评论(0)

花仙子 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档