二生物信息学数据库及检索.ppt

常用数据库简介 文献检索 PubMed PubMed BioMail / 查询GenBank数据库的目的 2. 己通过实验手段获得了某个或某些新的序列,希望先对其进行简单的序列注释;或者利用已知序列去搜索其它基因组中的同源基因等等。 1. 自己对某个基因感兴趣,但目前所研究材料中尚没有相关的信息,需要以其它亲缘关系较近的物种中已测序或已提交了的该基因的序列为参考,设计引物,在目标基因组中钓取该基因; 例子: 已知水稻中已克隆了与细胞程序性死亡相关的重要基因LSD1,但目前小麦中尚无该基因的相关信息,就可通过查询GenBank数据库的方式,先找出水稻LSD1基因的序列,然后利用Primer5等软件设计引物,通过RT-PCR等方法完全有可能在小麦中分离得到相应的基因。 /entrez/query.fcgi?db=PubMed PubMed is a service of the U.S. National Library of Medicine that includes over 17 million citations from MEDLINE and other life science journals for biomedical articles back to the 1950s. PubMed includes links to full text articles and other related resources. 数据库检索 检索数据库的方法 用关键词或词组进行数据库检索 (Text-based database searching) 用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching) 关键词或词组为基础的数据库检索 关键词 名词、描述性词、词组 序列注册号 (Accession number) 检索体系 Entrez Sequence Retrieval System (SRS) Integrated database retrieval system (DBGET) 检索须知(1) 连接词 AND, OR, NOT rice AND enzyme rice AND enzyme NOT kinase retrotransposon OR retroelement 用引号将两个单词组成一个词组 “disease resistance” disease resistance = disease AND resistance 检索须知(2) wild card“*”放在单词后使检索范围扩大, 但专一性降低 Wan* = 所有以 Wan 开头的单词 enzyme* = enzyme + enzymes 1. Entrez /Entrez/ NCBI 的检索体系 优点:三种检索体系中最容易操作的体系 缺点:检索范围有限 8大类35个与 Entreze 体系相连的数据库 Nucleotide Sequence Databases (8) CoreNucleotide, EST, GSS, SNP, Gene, HomoloGene, UniSTS, PopSet Protein Sequence Databses (2) Protein, Protein Clusters Structure Databases (4) Structure, PubChem Compound, 3D Domains, CDD Taxonomy Databases (1) Taxonomy Genome Databases (2) Genomes, Genome Project Expression Databases (4) UniGene, GEO Profiles, GEO DataSets, GENSAT Literature Databases (9) PubMed, PubMed Central, Site Search, Books, OMIM, OMIA, Journals, NLM Catalog, MeSH Other Databases (5) Probe, dbGaP, PubChem Substance, Cancer Chromosomes, PubChem BioAssay Entrez主页/Entrez/ Entrez系统中部分数据库之间的连接 检索方法(1):数据库之间检索 NCBI主页选择“Entrez Home”或Entrez主页,输入关键词

文档评论(0)

1亿VIP精品文档

相关文档