网站大量收购独家精品文档,联系QQ:2885784924

膜蛋白跨膜螺旋预测研究.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
膜蛋白跨膜螺旋预测的研究 摘 要 膜蛋白大约占活性生物中已发现的蛋白质总数的30%,它在活性 生物中的巨大作用可见一斑。膜蛋白已知的功能包括细胞间通信、调 节细胞膜内外溶质与离子传输、作为细胞的“感觉器官”等。这些功 能对维持生物活性至关重要。同时膜蛋白还是大部分药物的靶点,为 了研制更加有效的药物也必须充分了解膜蛋白。膜蛋白的功能与其结 构息息相关。然而,已知的高精度的膜蛋白结构非常少,因为膜蛋白 非常不容易结晶而且用核磁共振的方法也不易处理。已有的用实验方 法解出的螺旋膜蛋白少于500 个,与整个人类基因组中的大约10000 个螺旋膜蛋白相比,还有非常大的差距。在缺乏结构数据的情况下, 基于蛋白质氨基酸序列的计算机预测方法成为理想的辅助。 早期的预测方法利用了残基的疏水性系数绘制出蛋白质的疏水 曲线,然后选定一个阈值,大于阈值的部分则被预测为 TMH。这种方 法忽视了残基间的相互作用以及 TMH 结构中存在的其它的复杂相互 作用,导致了比较低的预测精度。现在已经逐渐被机器学习的方法所 取代。机器学习的方法包括隐马尔可夫模型 (HMMs)、神经网络 (NNs)、 基于证据理论的最近邻(OET-KNN)等。由此开发出了很多的预测器, 如 TOP-PRED、PHDhtm、MemBrain 等。机器学习方法能够从样本中学 习氨基酸之间的复杂联系,特别是在引入了进化信息的情况下。机器 第 I 页 学习方法的引入大大提高了 TMH 的预测精度。但这些方法都是对蛋白 质中单个的残基进行预测,然后得到该残基属于TMH 的概率。它们的 一大缺陷是没有利用TMH 的整体信息特别是末端信息,从而降低了预 测精度,特别是N,C 末端的精度。 本文提出一种考虑了TMH 末端信息的方法。该方法利用 SVM 分类 器对蛋白质序列的每个残基进行分类,得到其位于螺旋 N(C)末端 的概率。在用现有的机器学习方法预测出的TMH 区间基础上利用得到 的概率值对预测末端进行更新,得到更加准确的末端,从而提高跨膜 螺旋的预测精度特别是末端的预测精度。 预测方法被分为两个阶段,第一个阶段是用已有的机器学习方法 得到膜蛋白 TMH 的预测区间。本文选用的方法为 MemBrain。第二个 阶段则是用SVM 训练好的末端概率来更新预测区间,得到新的、更加 精确的预测区间。为了得到科学准确的预测结果,训练和验证数据样 本的选取是至关重要的。本文所用的数据全部是已知精确 3D 结构的 且只含有跨膜螺旋结构的膜蛋白。该数据集的使用保证了本文实验结 果的科学与准确。本文的实验结果是采用了现在通用的对数据做五倍 交叉验证后的平均结果。对结果的性能评价也利用了大多数预测方法 采用的每残基准确率和每跨膜螺旋准确率。为了检验对跨膜螺旋末端 预测的准确率引入了 N(C)分数。最后在对实验结果数据的分析基 础上,本文还引入了预测准确率相对不同的重叠长度标准的曲线。我 们的目的是尽可能准确的预测出一段跨膜螺旋位置,而不仅仅是一段 跨膜螺旋中的几个残基,该曲线证实了改进后的方法的确可以得到更 第 II 页 好的预测准确度,符合我们的期望。 关键字:膜蛋白,跨膜螺旋,二级结构预测,机器学习 第 III 页 The Research on Predicting Transmembrane Helix of Membrane Protein Abstract Membrane protein takes up more or less 30% of all discovered protein, which have indicated its significance in any living creature. The functionality of membrane protei

文档评论(0)

liybai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档