蛋白质亚细胞定位的辨认.pdfVIP

  • 835
  • 0
  • 约11.19万字
  • 约 53页
  • 2018-06-08 发布于贵州
  • 举报
蛋白质亚细胞定位的辨认

摘 要 对未知蛋白的功能注释是蛋白质组学的主要目标,其中一个关键的注释是对蛋白 质亚细胞定位的识别。蛋白质必须处于合适的亚细胞位置才能发挥其功能,因此蛋白 质的亚细胞定位信息对于了解其功能有重要意义。本文基于蛋白质的N端信号和氨基 酸组分,从氨基酸序列出发,对植物和非植物两类蛋白质数据集进行了亚细胞定位识 别。 首先,对不同亚细胞定位分类的蛋白质序列数据集进行特征分析,包括序列的单 氨基酸出现频率、紧邻二联体频率和 N端信号特征。结果显示单氨基酸组分分布在各 亚细胞定位分类的蛋白质序列数据集中有些差别,但不很显著;紧邻二联体频率在各 亚细胞定位分类的蛋白质序列数据集中是有区别的;N端信号特征在分泌类蛋白质数 据集中与另外三类数据集(植物)或两类数据集(非植物)有明显区别,并且N端特征 区别主要集中在N端前30个位置。 其次,我们采用了不同的分类特征应用多样性增量方法(ID)进行识别。(1)以 N 端信号特征为分类特征,取N端前20位氨基酸分布构成400维信息参数。(2)以氨基 酸紧邻二联体频数为特征构成 400 维信息参数。(3)选取氨基酸频数为特征构成 20 维信息参数

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档