- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学中基因数据库的发展要点
;;;;;;;;基因数据库的发展历史;基因组数据库的发展历史;GenBank数据库的发展历史;;NCBI’s Genbank (1982-);;EBI’s EMBL (1982-);NIG’s DDBJ (1987-);;;认识GenBank文件格式(头部);认识GenBank文件格式(特性表);认识GenBank文件格式(序列);;三大基因数据库;主要的数据库资源;1.2 NCBI上常用的生物学资源 ;; Entrez由美国NCBI开发,用于对文献摘要、序列、结构和基因组等数据库进行关键词查询,找出相关的一个或几个数据库条目。该系统目前主要包括核酸序列数据库、蛋白质序列数据库、基因组数据库、蛋白质结构数据库、生物医学文献摘要数据库、系统分类数据库、人类遗传疾病和遗传缺失在线数据库,以及基因信息数据库、种群亲缘关系核酸序列比对数据库、表达序列标签数据库等。; Entrez 是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。
因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。 ;
Entrez中核酸数据库为:GenBank, EMBL, DDBJ
蛋白质数据库为:Swiss-Prot, PIR, PFR, PDB
PubMed
基因组和染色体图谱资料;检索领域:(Search Fields);修改日期(Modification Date): 包含该条目进入Entrez的日期, 与出版日期一
样,以年/月/日形式出现
页数(Page Number): 该文章所在杂志的页码
特性(Property): 一个或几个关键词,用来描述该序列的类型
出版日期(Publication Date):包含文章出版日期以及序列录入GenBank的日期
PubMed ID: PubMed对每一个条目给出的识别标记
物种(Organism): 包含与该蛋白或核酸序列相关物种的学名和俗名
蛋白质名称(Protein name):
Seq Id: 与FASTA识别标记类似,为序列的一种识别标记
物质(Substance): 与该条目相关的化学物质名称;文字检索词(Text Words):包含文章中的所有词,其中:
Medline词目:标题和文摘
蛋白质词目: 定义,评论,蛋白名称,蛋白描述
核酸条目: 定义,评论,基因名称,基因名称
标题检索词(Title Words): 在标题中出现的词,或在描述该条目时出现的词
卷(Volume): 刊登该文章杂志所在卷
使用Medline UID, PubMed ID和 Seq ID进行检索时,在栏目框中要输入数字。如要输入多个数字,中间要用空格或逗号隔开。并选择相对应的检索领域;
www Entrez可以采用几种不同途径的检索方式:
名词列表格式(list term):当输入一检索词后,Entrez将列出与此相关的该领域中所有标准的检索词名称, 此时,可选择一或多个标准名词去检索。
自动格式(automatic):当输入一个检索词后,即自动检索,如果输入的检索词超过一个,则Entrez会自动将之组合起来, 如果无结果,则可尝试将这多个检索词用“ ”括起来。;
每一个文件都可以有数种阅读方式,目的各不相同。一般来说,“引文格式(citation)”最适合于阅读Medline形式的文件;“GenPept” 格式适用于阅读蛋白质文件;“GenBank”格式用来阅读核酸文件。;文字检索词(Text Words):包含文章中的所有词,其中:
Medline词目:标题和文摘
蛋白质词目: 定义,评论,蛋白名称,蛋白描述
核酸条目: 定义,评论,基因名称,基因名称
标题检索词(Title Words): 在标题中出现的词,或在描述该条目时出现的词
卷(Volume): 刊登该文章杂志所在卷
使用Medline UID, PubMed ID和 Seq ID进行检索时,在栏目框中要输入数字。如要输入多个数字,中间要用空格或逗号隔开。并选择相对应的检索领域;
每一个文件都可以有数种阅读方式,目的各不相同。一般来说,“引文格式(citation)”最适合于阅读Medline形式的文件;“GenPept” 格式适用于阅读蛋白质文件;“GenBank”格式用来阅读核酸文件。;1.2 NCBI上常用的生物学资源 ;4、数据库技术及数据挖掘;;;现状及问题;;;human;;;;;Major Application I:Designing Drugs;Major Application II: Fin
您可能关注的文档
- 生态系统的稳定性课件.ppt
- 生态系统的信息的传递 -.ppt
- 生态系统的保护(精品复习课件).ppt
- 生态系统的物质循环(共30张PPT).ppt
- 第1课 隋朝的统一与灭亡.ppt
- 第1讲荒漠化的防治——以我国西北地区为例.ppt
- 生态系统的类型.ppt
- 生态系统的结构与稳定性.ppt
- 生态系统的结构(完整版)1.ppt
- 生态系统的结构一轮复习 导学案.doc
- 2024年学校党总支巡察整改专题民主生活会个人对照检查材料3.docx
- 2025年民主生活会个人对照检查发言材料(四个带头).docx
- 县委常委班子2025年专题生活会带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”对照检查材料四个带头:.docx
- 巡察整改专题民主生活会个人对照检查材料5.docx
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)7.docx
- 2025年度民主生活会领导班子对照检查材料(“四个带头”).docx
- 国企党委书记2025年度民主生活会个人对照检查材料(五个带头).docx
- 带头严守政治纪律和政治规矩,维护党的团结统一等(四个方面)存在的问题整改发言提纲.docx
- 党委书记党组书记2025年带头增强党性、严守纪律、砥砺作风方面等“四个带头”个人对照检查发言材料.docx
- 2025年巡视巡察专题民主生活会对照检查材料.docx
最近下载
- 《ISO 55013-2024 资产管理-数据资产管理指南》解读和实施指导材料(雷泽佳编制-2024).pdf VIP
- 肿瘤放化疗病人并发症护理课件.pptx VIP
- 新概念第一册lesson79.pptx VIP
- 政府采购机票操作手册.pdf VIP
- 二级展开式斜齿圆柱齿轮减速器设计说明书.pdf
- 字节跳动产品运营专员岗面试题库参考答案和答题要点.docx VIP
- 小学英语单词(带音标).pdf VIP
- 字节跳动运营数据分析师岗面试题库参考答案和答题要点.docx VIP
- 八年级数学上册专题15 半角模型证全等(原卷版).docx VIP
- 字节跳动新媒体运营专员岗面试题库参考答案和答题要点.docx VIP
文档评论(0)