高中生物-生物信息学.pptxVIP

  • 49
  • 0
  • 约6.16千字
  • 约 69页
  • 2021-06-28 发布于江西
  • 举报
一、 生物信息学数据库;生物信息数据库的分类 一级数据库 数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 一级核酸数据库:EMBL ,GenBank ,DDBJ 一级蛋白质序列数据库:SWISS-PORT,PIR (GenBank ) 一级蛋白质结构数据库: PDB 二级数据库 对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立 人类基因组图谱库GDB 蛋白质结构分类数据库 SCOP,CATH 蛋白质序列功能位点数据库 Prosite;一、核酸序列数据库 1 、国际三大核酸序列数据库;1988年达成协议,三大数据库共同成立了国际核酸序列数据库联合中心,达成协议,对数据库的格式都采用相同格式,每一方只负责提交到自己数据库的数据,并共享,实现同步更新,以天为基础进行数据交换,并向世界开放,故这3个数据库又被称为公共序列数据库。所以从理论上说,这3个数据库所拥有的DNA序列数据是完全相同的。但如果你的研究需要实时(24小时以内)的,则要注意这些数据库间的记录是会有差异的。 ;一、核酸序列数据库;一、核酸序列数据库;一、核酸序列数据库;二、 数据库格式;;核酸序列; 氨基酸或核苷酸的符号的大小写同义,单个“连字符”表示一个空位 不清楚的核苷酸残基用N表示,不确定的氨基酸残基用X表示 标题行的名称是用户自定义的,可以是汉字,也可以是英文;2. 数据库格式:GBFF(GenBank flatfile,)格式;GenBank格式;一个简单的GenBank记录;FEATURES Location/Qualifiers source 1..3808 /organism=Limulus polyphemus /db_xref=taxon:6850 /tissue_type=lateral eye CDS 258..3302 /note=N-terminal protein kinase domain; C-terminal myosin heavy chain head; substrate for PKA /codon_start=1 /product=myosin III /protein_id=AAC16332.2 /db_xref=GI:7144485 /translation=MEYKCISEHLPFETLPDPGDRFEVQELVGTGTYATVYSAIDKQA NKKVALKIIGHIAENLLDIETEYRIYKAVNGIQFFPEFRGAFFKRGERESDNEVWLGI EFLEEGTAADLLATHRRFGIHLKEDLIALIIKEVVRAVQYLHENSIIHRDIRAANIMF SKEGYVKLIDFGLSASVKNTNGKAQSSVGSPYWMAPEVISCDCLQEPYNYTCDVWSIG ITAIELADTVPSLSDIHALRAMFRINRNPPPSVKRETRWSETLKDFISECLVKNPEYR PCIQEIPQHPFLAQVEGKEDQLRSELVDILKKNPGEKLRNKPYNVTFKNGHLKTISGQ BASE COUNT 1201 a 689

文档评论(0)

1亿VIP精品文档

相关文档