- 1、本文档共273页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复习2-2015-5.26
;一、 引言;;一个数据库记录(entry)一般由两部分组成:?;;;生物信息数据库;NCBI? National?Center?for?Biotechnology?Information?(US)?
EBI? European?Bioinformatics?Institute?(EU)?
HGMP? Human?Genome?Mapping?Project?Resource?Centre? (UK)
ExPASy? Expert?of?Protein?Analysis?System?(Switzerland?)?
CMBI? Centre?of?Molecular?and?Biomolecule?(The?Netherlands)?
ANGIS? National?Genome?Information?Service?(Australia)?
NIG? National?Institute?of?Genetics?(Japan)?
BIC ? National?Bioinformatics?Centre?(Singapore);;; 国际上权威的核酸序列数据库
(1)欧洲分子生物学实验室的EMBL?
http://www.embl-heidelberg.de
(2)美国生物技术信息中心的GenBank?
/Web/Genbank/index.html
?
(3)日本遗传研究所的DDBJ?
http://www.ddbj.nig.ac.jp
;三大主要核酸序列数据库;;美国的核酸数据库GenBank 从1979年开始建
设,1982年正式运行〖Banson,D.A.?et?al.?(1998)?Nucleic?Acids?Res.?26,?1-7〗;;;;;;部分生物基因组计划网址;GDB?(美国、加拿大)?;;AceDB?;;3?、蛋白质序列数据库?;SWISS?-PROT?;SWISS-PROT?(http://www.expasy.ch/sprot/sprot-top.html)
是目前国际上比较权威的蛋白质序列数据库,其中的蛋白
质序列是经过注释的;;(2?)最小冗余;;进入网站,后在搜索栏里键入关键词,点击“GO”图标;在搜索结果里找需要的信息即可; PIR?(protein?information?resource)?
1.? 由美国NCBI翻译自GenBank的DNA序列(1984年);?
2.? 在EMBL和GenBank数据库上均建立了镜像站点;?
3.? 数据依据注释的质量分为4类。
网址:?/?
PIR?数据库的分类情况 (Release?51.03)?;;;;;输入蛋白质代码1zni后search;;PDB?(protein?data?bank )?;PDB(Protein?Data?Bank);?? 一种是隐式序列信息(implicit?sequence)?;;以胰岛素(insulin)1zni为例;在搜索栏里输入蛋白质ID(PDB ID)1zni后搜索;用rasmol软件打开下载的1zni.pdb文件;;直接输入汉字“胰岛素”后搜索;;SCOP?(Structural?Classification?of?Protein?);;;1?、基因组信息二级数据库?;;2?、蛋白质序列二级数据库?;GenBank数据库检索及其应用——Entrez检索功能;NCBI网站网址:
; GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。;;Nucleotide 数据库分为三个子数据库:;;;简介;简介;;;ras[GENE];;;检索限定词:;获取所需要的基因序列;;;保存序列信息;;;简介;特殊标志符的格式(核酸序列):;(1)mRNA 记录(NM_*):
e.g.:NM_000492
(2)基因组的DNA重叠群(NT_*):
e.g.:NT_000347
(3)完整的基因组或染色体(NC_*):
e.g.:NC_000907
(4)基因组的局部区域(NG_*):
e.g.:NG_000019
(5)从人类基因组注释、加工得到的序列模型(XM,XP,or XR_*):
e.g.:XM_000483;特殊标志符的格式(核酸序列):;简介;序列长度的检索限定词:[SLEN];;简介;范围检索:中间用冒号连接;简介;限制检索;简介;排除某种类型的序列;简介;预检索输入框;;;;简介;;简介;;简介;;简介;;序列相似性搜索;;;;GenBank和PubMed(序列数据)检索的比较:;
文档评论(0)