生物信息学6二级数据库和数据库的格式.pptVIP

  • 8
  • 0
  • 约1.05万字
  • 约 45页
  • 2017-05-20 发布于四川
  • 举报

生物信息学6二级数据库和数据库的格式.ppt

小结:数据库一览 1、核酸序列数据库 EMBL GenBank DDBJ 2、基因组数据 GDB AceDB 3、蛋白质序列数据库 SWISS-PROT PIR(美国) 4、蛋白质结构数据 PDB 5、蛋白质结构分类数据库 SCOP CATH 6、二级数据库 TransFac Prosite DSSP FSSP HSSP 不同数据库的序列格式 在运行序列分析软件中遇到的首要问题就是如何通过不同的程序使用不同的序列格式。这些格式都是标准ASCII码文件,但在显示各种信息或序列本身的某些字符或字有所不同。下面将讨论几种常用的序列格式。 1. GenBank中DNA序列格式 GenBank中数据库(包括NCBI核酸和蛋白质序列数据库)中条目格式如下:给出描述每一个序列的信息,包括文献参考、序列的功能信息、mRNA和编码区域的位置,以及重要突变的位置。这些序列信息以字段的形式进行组织,每一行最前端都有一个标识符。在某些条目中,标识符可能缩写成两个字母(例如RF代表reference),某些字段可能还有次级字段。计算机程序中的序列条目位于标识符“ORIGIN”和“//”之间。这些字段提供的信息可以参见网页/Sitemap/samplerecord

文档评论(0)

1亿VIP精品文档

相关文档