NCBI主要基因序列数据库.PDFVIP

  • 487
  • 0
  • 约8.24千字
  • 约 74页
  • 2018-12-03 发布于天津
  • 举报
NCBI主要基因序列数据库

生物信息学 第五章:生物序列的数据库信息检索 本章内容提要 1,序列数据库 2 ,序列家族分类及功能数据库 3,检索系统 4 ,双序列Blast比对实例 5,序列数据信息检索实例 1 ,序列数据库 核酸序列数据库 国际三大核酸序列数据库: GenBank, EBML, DDBJ dbEST: Expressed Sequences Tags数据库 UniGene等 RefSeq: The Reference Sequence Database 蛋白质序列数据库 UniProt (Swiss-prot TrEMBL, PIR) 基因组数据库: Ensembl NCBI数据资源 Nucleotide: 核酸序列数据库 PubMed: 生物医学科学文摘数据库 GEO :基因表达谱数据库。收集存储微阵列基因表 达数据 Protein: 蛋白质序列数据库 SNP: 单核苷酸多态性数据库 Taxonomy: 物种分类学数据库 Gene: 基因数据库。提供序列及基因描述信息 Structure: 大分子三维结构数据库 3D Domains: 特定功能域的三维结构数据库 UniGene: GenBank分离的非冗余基因簇。包含已 确定基因和EST。每个簇包含唯一的非冗余的基因序 列、表达的组织类型和基因图谱位点。 UniSTS: 序列标签位点数据库,用于作图位点 PopSet: 人口研究数据库 Books: 在线生物医学图书数据库 OMIM: 在线人类孟德尔遗传目录数据库 Conserved Domains: 保守结构域数据库 Cancer Chromosomes: 癌症染色体数据库 Homologene: 基因同源物数据库 Journals: 杂志及出版社信息数据库 Genome: 基因组数据库,提供完成的基因组/染色体图 形 GDS: GEO的基因表达实验与生物芯片数值结果数据库 NCBI主要基因序列数据库  GenBank :包含了所有已知的核酸序列和蛋白质序列 ,以及与它们相关的文献著作和生物学注释。其数据 直接来源于测序工作者提交的序列,为原始数据积累 的开放数据库,数据可能存在重复以及不准确。  UniGene :对核酸序列数据库的数据进行适当处理, 剔除冗余部分后,同一基因包括表达序列标签的序列 簇,多用于研究基因的转录图谱。  RefSeq :提供非冗余的,高质量的,经检验校正的序 列信息;包括染色体、基因组(细胞器、病毒、质 粒)、蛋白质、RNA等。 Nucleotide database including GenBank, RefSeq, TPA and PDB.  Genome, gene and transcript sequence data provide the foundation for biomedical research and discovery. Entres-Gene数据库  序列来源于Refseq数据库;  详尽的注释信息,包括基因在基因组的定位,基因 名称、蛋白质名称,基因结构等; 基因的命名主要来自权威命名委员会的官方符号以 及Refseq记录中的基因名,由NCBI工作人员进行 数据收集并注释。NLM的索引部门对基因功能进行 阐述。 沿用人类孟德尔遗传网(OMIM)中的疾病名称并 与NCBI其他数据库形成交互链接。 NCBI Gene  /sites/entrez?db=gene UniProt Universal Protein Resource : Swiss-prot(TrEMBL), PIR两大蛋白数据库的整合 体; 收录蛋白质序列目录最广泛、功能注释最全面的 数据库; 包含三个子库: UniProtKB (UniProt Knowledgebase) UniRef (UniProt Reference Clusters) UniParc (Uniprot Archive)  2 ,序列家族分类及功能数据库 蛋白质序列分类数据库- Pfam 蛋白质序列功能位点数据库 PROSITE Gene

文档评论(0)

1亿VIP精品文档

相关文档