- 49
- 0
- 约6.16千字
- 约 69页
- 2021-06-28 发布于江西
- 举报
一、 生物信息学数据库;生物信息数据库的分类
一级数据库
数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释
一级核酸数据库:EMBL ,GenBank ,DDBJ
一级蛋白质序列数据库:SWISS-PORT,PIR (GenBank )
一级蛋白质结构数据库: PDB
二级数据库
对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立
人类基因组图谱库GDB
蛋白质结构分类数据库 SCOP,CATH
蛋白质序列功能位点数据库 Prosite;一、核酸序列数据库
1 、国际三大核酸序列数据库;1988年达成协议,三大数据库共同成立了国际核酸序列数据库联合中心,达成协议,对数据库的格式都采用相同格式,每一方只负责提交到自己数据库的数据,并共享,实现同步更新,以天为基础进行数据交换,并向世界开放,故这3个数据库又被称为公共序列数据库。所以从理论上说,这3个数据库所拥有的DNA序列数据是完全相同的。但如果你的研究需要实时(24小时以内)的,则要注意这些数据库间的记录是会有差异的。 ;一、核酸序列数据库;一、核酸序列数据库;一、核酸序列数据库;二、 数据库格式;;核酸序列;
氨基酸或核苷酸的符号的大小写同义,单个“连字符”表示一个空位
不清楚的核苷酸残基用N表示,不确定的氨基酸残基用X表示
标题行的名称是用户自定义的,可以是汉字,也可以是英文;2. 数据库格式:GBFF(GenBank flatfile,)格式;GenBank格式;一个简单的GenBank记录;FEATURES Location/Qualifiers
source 1..3808
/organism=Limulus polyphemus
/db_xref=taxon:6850
/tissue_type=lateral eye
CDS 258..3302
/note=N-terminal protein kinase domain; C-terminal myosin
heavy chain head; substrate for PKA
/codon_start=1
/product=myosin III
/protein_id=AAC16332.2
/db_xref=GI:7144485
/translation=MEYKCISEHLPFETLPDPGDRFEVQELVGTGTYATVYSAIDKQA NKKVALKIIGHIAENLLDIETEYRIYKAVNGIQFFPEFRGAFFKRGERESDNEVWLGI EFLEEGTAADLLATHRRFGIHLKEDLIALIIKEVVRAVQYLHENSIIHRDIRAANIMF SKEGYVKLIDFGLSASVKNTNGKAQSSVGSPYWMAPEVISCDCLQEPYNYTCDVWSIG ITAIELADTVPSLSDIHALRAMFRINRNPPPSVKRETRWSETLKDFISECLVKNPEYR PCIQEIPQHPFLAQVEGKEDQLRSELVDILKKNPGEKLRNKPYNVTFKNGHLKTISGQ
BASE COUNT 1201 a 689
原创力文档

文档评论(0)