- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质27类折叠子序列的特征分析和预测
内蒙古工业大学学报
JOURNAL OFINNERMONGOLIA
UNIVERSITY OFTECHN()LOGY
文章编号:1001—5l67(2009)04—0268—06
蛋 白质27类折叠子序列的特征分析和预测
张,14光,胡秀珍
内蒙古工业大学理学 院,呼和浩特 010051)
摘要 :通过对27类蛋白质折叠子的统汁分析,发现位点氨基酸及氨基酸二肽组分
可以在一定程度上反映蛋 白质折叠子信息.文中采用整体分类策略.基于离散增量
的方法分别以位点氨基酸、氨基酸二肽组分等信息为参数对27类蛋 白质折叠子进
行了识别研究.为了进一步提高识别的精度 ,以次邻二肽组分、氨基酸组分、亲疏水
和极性氨基酸组分共同作为参数,得到了较好 的识别结果.
关键词 :离散量;离敞增量;蛋白质折叠子
中图分类号 :Q61 文献标识码 :A
0 引 言
蛋白质的折叠子类是介于蛋 白质二级结构和高级结构之间的一个结构层次,折叠子反映了一个蛋
白质核心结构的拓扑结构模式.许多研究表明,蛋 白质的折叠、结构与功能具有很高的一致性 ,特定折叠
于行使特定的生理功能,某些折叠于的错误折叠可引发疾病,如疯牛病,阿兹海默氏症等 .然而国内
外对多类折叠子的理论识别研究进展一直很缓慢,近年来才得到学者们的重视.2001年Ding&
Dubchak 选取氨基酸组分、范德瓦尔斯齄、二级结构、亲疏水、极性等参数,用神经网络和支持 向量机
的方法对多类折叠子进行了研究,采用 “一对一”分类策略识别时精度达到了56 .2003年Chung“等人
用神经网络和支持 向量机方法对折叠子的识别精度为44.2 .2006年Shen Chou 选取赝氨基酸组
分做参数,采用全体分类法对27类折叠子的识别精度为62.1 .Zhang踟、Shi采用支持向量机的方法
分别选用 “唯一的--X~多”和 “一对一”分类策略对27类折叠子的最高识别精度为41.9195/和61.04 .总
之,一些识别方法着重于分类策略的研究,另一些则着重于算法的改进和参数的选取.
本文通过对27类折叠子的统计分析 ,发现位点氨基酸及氨基酸二肽组分可 以在一定程度上反映蛋
白质折叠子信息,因此在识别参数中增加了位点氨基酸和氨基酸二肽组分 ;同时也选取了其它文献中使
用过的氨基酸组分、亲疏水、极性氨基酸组分等参数.基于整体分类策略,用离散增量的方法对27类蛋
白质折叠子进行了研究,当融合上述各种参数共同作为识别参数时,对27类折叠子的识别结果较好.
1 材料和方法
1.1 数据库
本文使用的数据库最早由Ding.Dubchak 描述,后来被Shen&.Chou 使用,Zhang 和Shi0也
使用此数据库对27类折叠子进行了研究.数据库中训练集和检验集样本数 目分别是 313和385,样本序
列同源性低于35 .但训练集中的样本2SCM —C、2GPS和测试集中的样本2YHX 1、2YHX
一 一 2找不到
+ 收稿 日期:2008—04—09
基金项 目:内蒙古自治区高等学校科学研究项 目(NJZYO8O59)
作者简介 :张怀光 (1983~).男.内蒙古工业大学理学院.硕士研究生.
通讯联系人 :E—mail:hxz@imut.edu.cn
第4期 张怀光等 蛋 白质 27类折叠子序列的特征分析和预测
记录,因此去除这四条样本得到 的训练集和检验集的样本数 目分别是31l和383.
数据库的训练集和检验集样本在SCOP库中分别被分成27类折叠子,详见表 1.数据库训练集样本
1GP1A和4CPA I的序列中分别含有一个x和两个z,检验集样本lWGT—A1和lESt一2的序列中
分别含一个x和一个空格 ,本文整理数据库过程 中,将以上序
您可能关注的文档
最近下载
- 《科学探究:欧姆定律》名师课件.ppt VIP
- 网络服务业网络安全保障与应急响应机制建设方案.doc VIP
- 2025年高中《通用技术》考试卷(含答案) .pdf VIP
- 堰水力计算水利工程.xls VIP
- 人教版(2024新版)七年级上册生物期末复习知识点背诵提纲.docx VIP
- 2025 全国青少年信息素养大赛 Python 编程挑战赛(个人赛)初中组决赛模拟试卷(一).docx VIP
- 一种推送滚轮.pdf VIP
- EPC项目:基于风险管控的质量体系构建与实施.docx VIP
- 4洗涤剂总活性物的测定.pdf VIP
- 沙库巴曲缬沙坦联合松龄血脉康胶囊治疗老年高血压病合并慢性心力衰竭的.pptx VIP
文档评论(0)