基于添加模体信息和功率谱密度组合向量预测27类蛋白质折叠子.pdfVIP

基于添加模体信息和功率谱密度组合向量预测27类蛋白质折叠子.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
物物理学报 2010 年9 月 第26 卷 第9 期: 823-832 A CTA BIO PHYS ICA S INICA 20 10 Vol.26 No.9: 823-832 www.cj 研究论文/ Research Article 基于添加模体信息和功率谱密度的组合 向量预测27 类蛋白质折叠子 刘雷, 胡秀珍 蒙古工业大学理学院,呼和浩特 010051 收稿日期:2010-01-17;接受日期:2010-05-16 基金项目:国家自然科学基金项目 ; 蒙古自治区高等学校科学研究项目(NJZY08059) 通讯作者:胡秀珍,电话:(0471)6576281,E-mail :hxz@ 摘要:以序列相似性低于40% 的1895 条蛋白质序列构建涵盖27 个折叠类型的蛋白质折叠子数 据库 从蛋白质序列出发 用模体频数值尧 低频功率谱密度值尧 氨基酸组分尧 预测的二级结构 信息和自相关函数值构成组合向量表示蛋白质序列信息 采用支持向量机算法 基于整体分类 策略 对27 类蛋白质折叠子的折叠类型进行预测 独立检验的预测精度达到了66.67%遥 同时 以同样的特征参数和算法对27 类折叠子的4 个结构类型进行了预测 独立检验的预测精度达到 了89.24% 遥 将同样的方法用于前人使用过的27 类折叠子数据库 得到了好于前人的预测结果遥 关键词:模体频数曰 功率谱密度曰 支持向量机曰 蛋白质折叠子曰 蛋白质结构类型 中图分类号:Q61 0 引 言 蛋白质折叠子反映了一个蛋白质核心结构的拓扑结构模式,包括蛋白质分子空间结构 组成的三个主要方面,即二级结构单元、二级结构单元的相对排布位置关系,以及蛋白质 多肽链的整个路由关系 即肽链走向冤 [1]。大量研究表 ,蛋白质的生物活性不仅决定于蛋 白质分子的一级结构,而且与其特定的空间结构密切相关,特定折叠子行使特定的生理功 能,某些折叠子的异常折叠可引发疾病,如疯牛病、阿尔兹罕默氏病、帕金森氏病、癌症 [2 4] 等 。因此,蛋白质折叠子的研究,尤其是27 类折叠子的识别研究,一直是生物信息学 的重要课题。 近年来,国 外许多研究者在27 类折叠子的识别方面已做了一些工作。2001 年,Ding 和Dubchak[5]选取氨基酸组分、极性、极化率、范德瓦尔斯量、疏水性和二级结构6 种特 征,基于“一对多”、 “唯一的一对多”和 “一对一”的分类策略,用神经网络和支持向量 机方法对27 类蛋白质折叠子的类别进行了研究,预 精度达到了56% 。2004 年,张绍武 [6] 等 以氨基酸组分和自相关函数值为参数,采用 “唯一的一对多” 策略,用支持向量机方 [7] 法对27 类蛋白质折叠子的类别进行预 ,精度达到44.22% 。2005 年,Chinnasamy 等 采 用Ding 和Dubchak[5]用到的6 种特征参数,构建进化树和贝叶斯分类器,对27 类折叠子类 823 研究论文/ Research Article 生物物理学报 2010 年 第26 卷第9 期 别进行预 ,总精度达到58.18 %;同时,Chinnasamy 等还以同样的方法对27 类折叠子的 [8] 结构类型进行了研究,预 精度为80.52% 。2006 年,施建宇等人 也从蛋白质序列中提取 了同样的6 种特征参数,采用三层支持向量机融合网络方法,在“多对多”的分类策略下, 对27 类折叠子类别的预 精度达到了61.04% 。同年,Shen 和Chou[9] 结合序列顺序信息, 采用基于伪氨基酸组分的优化证据理论 K 近邻 ( optimized evidenc

文档评论(0)

nnh91 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档