蛋白质组数据格式.pptxVIP

  • 217
  • 0
  • 约1.56千字
  • 约 21页
  • 2018-02-27 发布于广东
  • 举报
蛋白质组数据格式 六组:亓慧敏 王潇 刘慧芳 杨忠蛋白质一级结构 在每种蛋白质中,多肽链中氨基酸的排列顺序,包括二硫键的位置,我们称为蛋白质一级结构。 与蛋白质一级结构相关的数据格式:FASTA、GenPept、GFF等FASTA格式:描述信息标识符GenPept格式:描述信息序列条目的关键字包括LOCUS (代码),DEFINITION (说明),ACCESSION (编号),NID符(标识符),KEYWORDS (关键词),SOURCE (数据来源),REFERENCE (文献),FEATURES (特性表),BASE COUNT (氨基酸组成)及ORIGIN (氨基酸排列顺序)等。GFF格式:注释信息描述来源编号蛋白质二级结构 蛋白质二级结构指多肽链中有规则重复的构象,限于主链原子的局部空间排列。 与蛋白质二级结构相关的文件格式:Dssp、CNS等Dssp格式:二级结构H = alpha helix B = residue in isolated beta-bridge E = extended strand, participates in beta ladder G = 3-helix (3/10 helix) I = 5 helix (pi helix) T = hydrogen bonded turn S = bend Blank = l

文档评论(0)

1亿VIP精品文档

相关文档