- 18
- 0
- 约1.27万字
- 约 22页
- 2018-08-31 发布于福建
- 举报
基于随机下采样和SVR蛋白质ATP绑定位点预测
基于随机下采样和SVR蛋白质ATP绑定位点预测
摘 要: 将蛋白质序列的ATP绑定位点与非绑定位点进行分类是个不平衡的二分类问题,其中绑定位点是样本数目稀少的正类样本,非绑定位点是样本数目众多的负类样本。根据机器学习关于可以将分类问题作为回归问题的特例的观点出发,并根据所研究问题本身的特点,在此提出一种基于随机下采样和支持向量回归的蛋白质?ATP绑定位点预测方法。首先,使用滑动窗口抽取蛋白质序列中每个残基的特征,得到一批不平衡的两类样本;其次,应用随机下采样策略,消除正负样本存在的显著不平衡;最后,使用支持向量回归建立预测模型,并选取合适的阈值进行蛋白质?ATP绑定位点的预测。在标准数据集上的实验结果以及与几种最新报道的预测方法的对比结果,验证了本文所述方法的有效性。
关键词: 蛋白质?ATP绑定位点; 位置特异性得分矩阵; 滑动窗口; 支持向量回归模型; 随机下采样
中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2015)04?0019?06
0 引 言
三磷酸腺苷(Adenosine 5′?triphosphate,ATP)在分子细胞生物学中扮演着一个重要的角色,如膜运输、细胞活性、肌肉收缩、信号、复制和转录DNA、以及各种代谢过程[1?2]。ATP与蛋白质相互作用是通过蛋白质的ATP绑定位点进行ATP绑定,通
原创力文档

文档评论(0)