- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
物物理学报 2010 年9 月 第26 卷 第9 期: 823-832
A CTA BIO PHYS ICA S INICA 20 10 Vol.26 No.9: 823-832 www.cj 研究论文/ Research Article
基于添加模体信息和功率谱密度的组合
向量预测27 类蛋白质折叠子
刘雷, 胡秀珍
蒙古工业大学理学院,呼和浩特 010051
收稿日期:2010-01-17;接受日期:2010-05-16
基金项目:国家自然科学基金项目 ; 蒙古自治区高等学校科学研究项目(NJZY08059)
通讯作者:胡秀珍,电话:(0471)6576281,E-mail :hxz@
摘要:以序列相似性低于40% 的1895 条蛋白质序列构建涵盖27 个折叠类型的蛋白质折叠子数
据库 从蛋白质序列出发 用模体频数值尧 低频功率谱密度值尧 氨基酸组分尧 预测的二级结构
信息和自相关函数值构成组合向量表示蛋白质序列信息 采用支持向量机算法 基于整体分类
策略 对27 类蛋白质折叠子的折叠类型进行预测 独立检验的预测精度达到了66.67%遥 同时
以同样的特征参数和算法对27 类折叠子的4 个结构类型进行了预测 独立检验的预测精度达到
了89.24% 遥 将同样的方法用于前人使用过的27 类折叠子数据库 得到了好于前人的预测结果遥
关键词:模体频数曰 功率谱密度曰 支持向量机曰 蛋白质折叠子曰 蛋白质结构类型
中图分类号:Q61
0 引 言
蛋白质折叠子反映了一个蛋白质核心结构的拓扑结构模式,包括蛋白质分子空间结构
组成的三个主要方面,即二级结构单元、二级结构单元的相对排布位置关系,以及蛋白质
多肽链的整个路由关系 即肽链走向冤 [1]。大量研究表 ,蛋白质的生物活性不仅决定于蛋
白质分子的一级结构,而且与其特定的空间结构密切相关,特定折叠子行使特定的生理功
能,某些折叠子的异常折叠可引发疾病,如疯牛病、阿尔兹罕默氏病、帕金森氏病、癌症
[2 4]
等 。因此,蛋白质折叠子的研究,尤其是27 类折叠子的识别研究,一直是生物信息学
的重要课题。
近年来,国 外许多研究者在27 类折叠子的识别方面已做了一些工作。2001 年,Ding
和Dubchak[5]选取氨基酸组分、极性、极化率、范德瓦尔斯量、疏水性和二级结构6 种特
征,基于“一对多”、 “唯一的一对多”和 “一对一”的分类策略,用神经网络和支持向量
机方法对27 类蛋白质折叠子的类别进行了研究,预 精度达到了56% 。2004 年,张绍武
[6]
等 以氨基酸组分和自相关函数值为参数,采用 “唯一的一对多” 策略,用支持向量机方
[7]
法对27 类蛋白质折叠子的类别进行预 ,精度达到44.22% 。2005 年,Chinnasamy 等 采
用Ding 和Dubchak[5]用到的6 种特征参数,构建进化树和贝叶斯分类器,对27 类折叠子类
823
研究论文/ Research Article 生物物理学报 2010 年 第26 卷第9 期
别进行预 ,总精度达到58.18 %;同时,Chinnasamy 等还以同样的方法对27 类折叠子的
[8]
结构类型进行了研究,预 精度为80.52% 。2006 年,施建宇等人 也从蛋白质序列中提取
了同样的6 种特征参数,采用三层支持向量机融合网络方法,在“多对多”的分类策略下,
对27 类折叠子类别的预 精度达到了61.04% 。同年,Shen 和Chou[9] 结合序列顺序信息,
采用基于伪氨基酸组分的优化证据理论 K 近邻 ( optimized evidenc
您可能关注的文档
最近下载
- 3#T8030-25U塔吊安拆施工方案.docx VIP
- 《临床研究协调员(CRC)从业能力要求》(TZJPA 001-2024).pdf VIP
- 《北美国际护理诊断定义与分类(2021-2023)》修订解读.pptx VIP
- 规范《DGJ32J33-2006-江苏省建筑安装工程施工技术操作规程-地面工程》.pdf VIP
- 《智能网联汽车概论(活页式)》全套教学课件.pptx
- ABB机器人通讯介绍.pptx VIP
- DB32╱T 3839-2020 水闸泵站标志标牌规范.docx
- Word页眉页脚模板06.docx VIP
- 04J008挡土墙图集标准.pdf
- QC成果-提高大型储罐现场防腐质量验收一次合格率.pdf VIP
文档评论(0)