- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 30 卷 第 1 期 上海第二工业大学学报 Vol.30 No.1
2013 年 3 月 JOURNAL OF SHANGHAI SECOND POLYTECHNIC UNIVERSITY Mar. 2013
文章编号: 1001-4543(2013)01-0012-06
基于线性降维方法的蛋白质四级结构类型预测基于线性降维方法的蛋白质四级结构类型预测
基于线性降维方法的蛋白质四级结构类型预测基于线性降维方法的蛋白质四级结构类型预测
王 彤,杨志珍 ,曹晓夏
(上海第二工业大学计算机与信息学院,上海201209 )
摘 要:提出一种新的能依据蛋白质序列自动地识别被查询蛋白质的四级结构类型的方法。首先采用伪特定位点记
分矩阵方法(PsePSSM)提取蛋白质序列的特征 。采用这种方法提取出的特征能尽可能多地反映蛋白质序列的原始信
息如顺序和进化等信息 。但随之产生的问题是特征维数很高,使得预测系统复杂化。因此,引入线性维数约简算法
最大方差映射方法(MVP),它可以从高维的特征空间中提取出低维的关键特征。最后,在约简后的特征上再应用分
类算法预测未知蛋白质的四级结构 。试验结果表明,采用降维方法不但使得预测系统得到简化,同时还提高了分类
性能 。
关键词:蛋白质四级结构;同源寡聚蛋白质;分类;降维
中图分类号:TP391; Q617 文献标志码:A
0 引言
1958 年 Bernal 首次提出了蛋白质四级结构的概念。蛋白质的四级结构被看成是蛋白质一级结构、二级
[1]
结构和三级结构的延伸 ,是指蛋白质的多条多肽链之间相互作用所形成的更为复杂的聚合物的一种结构形
式,主要描述了蛋白质亚基空间排列以及亚基之间的连接和相互作用。蛋白质四级结构有不同的分类方法
和类型。按亚基的组成分类可分为同源寡聚体和异源寡聚体。同源寡聚体是指由相同的亚基形成的复合物,
异源寡聚体则是指由不同的亚基形成的复合物。本文主要研究的是同源寡聚体的类型。寡聚体蛋白质的结
构根据亚基的个数可分为二聚体、三聚体、四聚体等等。由两个亚基组成的蛋白质叫二聚体蛋白质,由三
个亚基组成的蛋白质叫三聚体蛋白质,依此类推。
目前,有许多方法来研究依据蛋白质序列预测蛋白质的四级结构。最具代表性的是 Chou 和 Elrod 提出
的基于伪氨基酸组成(Pseudo Amino Acid composition, PseAA) 的协方差判别算法(Covariant Discriminant, CD)
[2] [3]
来预测蛋白质的四级结构 。PseAA 是一种表示蛋白序列的离散化模型,是在原始的20 维氨基酸组成向量
的基础上加入一系列序列顺序因子。由于该顺序因子包含了序列中氨基酸的相互位置关联信息,因此其有
效性比传统的 20 维氨基酸模型要高。近年来,一些学者提出了一个蛋白质序列的离散模型伪特定位点记分
矩阵方法(Pseudo Position-Specific Scoring Matrix, PsePSSM) [4] 。它不但考虑了蛋白质序列的顺序信息,还考
虑了蛋白质的进化信息。在以前的工作中,PsePSSM 方法被用于预测膜蛋白类型和亚细胞位置。许多试验
结果表明,它是一个有效的蛋白质序列离散化方法。本文也采用这种方法来表示蛋白质序列。这种方法虽
然十分有效,但会产生高维特征向量,这样会给统计预测带来一系列的问题。为了克服这个困难,本文尝
试提出采用最大方差映射方法(Maximum Variance Projections, MVP) [5]从高维空间中提取出有用的特征信息。
文档评论(0)