蛋白质27类折叠子序列的特征分析和预测.pdfVIP

蛋白质27类折叠子序列的特征分析和预测.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质27类折叠子序列的特征分析和预测

内蒙古工业大学学报 JOURNAL OFINNERMONGOLIA UNIVERSITY OFTECHN()LOGY 文章编号:1001—5l67(2009)04—0268—06 蛋 白质27类折叠子序列的特征分析和预测 张,14光,胡秀珍 内蒙古工业大学理学 院,呼和浩特 010051) 摘要 :通过对27类蛋白质折叠子的统汁分析,发现位点氨基酸及氨基酸二肽组分 可以在一定程度上反映蛋 白质折叠子信息.文中采用整体分类策略.基于离散增量 的方法分别以位点氨基酸、氨基酸二肽组分等信息为参数对27类蛋 白质折叠子进 行了识别研究.为了进一步提高识别的精度 ,以次邻二肽组分、氨基酸组分、亲疏水 和极性氨基酸组分共同作为参数,得到了较好 的识别结果. 关键词 :离散量;离敞增量;蛋白质折叠子 中图分类号 :Q61 文献标识码 :A 0 引 言 蛋白质的折叠子类是介于蛋 白质二级结构和高级结构之间的一个结构层次,折叠子反映了一个蛋 白质核心结构的拓扑结构模式.许多研究表明,蛋 白质的折叠、结构与功能具有很高的一致性 ,特定折叠 于行使特定的生理功能,某些折叠于的错误折叠可引发疾病,如疯牛病,阿兹海默氏症等 .然而国内 外对多类折叠子的理论识别研究进展一直很缓慢,近年来才得到学者们的重视.2001年Ding& Dubchak 选取氨基酸组分、范德瓦尔斯齄、二级结构、亲疏水、极性等参数,用神经网络和支持 向量机 的方法对多类折叠子进行了研究,采用 “一对一”分类策略识别时精度达到了56 .2003年Chung“等人 用神经网络和支持 向量机方法对折叠子的识别精度为44.2 .2006年Shen Chou 选取赝氨基酸组 分做参数,采用全体分类法对27类折叠子的识别精度为62.1 .Zhang踟、Shi采用支持向量机的方法 分别选用 “唯一的--X~多”和 “一对一”分类策略对27类折叠子的最高识别精度为41.9195/和61.04 .总 之,一些识别方法着重于分类策略的研究,另一些则着重于算法的改进和参数的选取. 本文通过对27类折叠子的统计分析 ,发现位点氨基酸及氨基酸二肽组分可 以在一定程度上反映蛋 白质折叠子信息,因此在识别参数中增加了位点氨基酸和氨基酸二肽组分 ;同时也选取了其它文献中使 用过的氨基酸组分、亲疏水、极性氨基酸组分等参数.基于整体分类策略,用离散增量的方法对27类蛋 白质折叠子进行了研究,当融合上述各种参数共同作为识别参数时,对27类折叠子的识别结果较好. 1 材料和方法 1.1 数据库 本文使用的数据库最早由Ding.Dubchak 描述,后来被Shen&.Chou 使用,Zhang 和Shi0也 使用此数据库对27类折叠子进行了研究.数据库中训练集和检验集样本数 目分别是 313和385,样本序 列同源性低于35 .但训练集中的样本2SCM —C、2GPS和测试集中的样本2YHX 1、2YHX 一 一 2找不到 + 收稿 日期:2008—04—09 基金项 目:内蒙古自治区高等学校科学研究项 目(NJZYO8O59) 作者简介 :张怀光 (1983~).男.内蒙古工业大学理学院.硕士研究生. 通讯联系人 :E—mail:hxz@imut.edu.cn 第4期 张怀光等 蛋 白质 27类折叠子序列的特征分析和预测 记录,因此去除这四条样本得到 的训练集和检验集的样本数 目分别是31l和383. 数据库的训练集和检验集样本在SCOP库中分别被分成27类折叠子,详见表 1.数据库训练集样本 1GP1A和4CPA I的序列中分别含有一个x和两个z,检验集样本lWGT—A1和lESt一2的序列中 分别含一个x和一个空格 ,本文整理数据库过程 中,将以上序

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档