小波支持向量机在蛋白质构造功能预测中的应用.pdfVIP

小波支持向量机在蛋白质构造功能预测中的应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小波支持向量机在蛋白质构造功能预测中的应用

摘要 摘 要 随着人类基因组计划(HGP)的顺利完成和现在生物科学和技术的迅猛发展, 每天都有大量的蛋白质序列数据不断涌现。对这些数据进行深入研究以达到对 化学和生物意义的深入理解是现代生物信息学的热点。蛋白质结构分析的经典 方法是x射线晶体学和多维核磁共振技术。这些技术昂贵、费时、甚至有些蛋 白质根本无法用这些方法测出结构;而另一方面,蛋白质测序显得相对简单、 快捷和廉价。因此,从蛋白质序列出发,发展自动、可靠的理论预测方法具有 十分重要的理论意义和实用价值。本文根据蛋白质结构、功能的预测研究现状, 采用新兴的机器学习方法一支持向量机,并结合离散小波变换技术,对蛋白质 的结构与功能预测进行研究,其主要内容如下: 1.提出了预测蛋白质二级结构的新方法一小波支持向量机方法。本文定义 了一种新颖的蛋白质序列表征方法,用于表征蛋白质样本,采用小波支持向量 机对蛋白质的二级结构类型进行预测。对文献中常用的非同源蛋白质的数据集 进行了自检验和留一法检验,预测结果得到了显著提高。在此基础上,进一步 深入研究蛋白质序列的同源性对预测准确率的影响;对Chou构建的高同源蛋 白质数据库(同源性高于95%)和Wang构建的低同源蛋白质数据库(同源性 为30%)进行了测试,结果表明,蛋白质序列的同源性对蛋白质二级结构预测 的准确率有较大的影响。 2.建立了酶与非酶分类预测的新方法。以代码为脚刀酶蛋白为例,描述 了应用离散小波变换提取酶结构特征向量的过程;并对小波尺度、小波函数和 疏水标度值等影响因素进行了探讨和优化。采用Paul等人构建的数据库P1178, 以及Cai等人构建的数据集C1200对本方法进行了验证,总的预测精度分别达 到了95.59%和93.75%,优于现有文献的报道。同时,还分析了预测结果出现 偏差的原因。结果表明,离散小波能有效地解析氨基酸序列信号,并有力地从 小波分解系数提取酶蛋白序列的结构特征;与国际上流行的方法相比,本法具 摘要 有预测简单、直观和准确率高等优点。 3.建立了凋亡蛋白亚细胞位点预测新方法。基于离散小波技术,提出了小 波支持向量机方法,用于凋亡蛋白亚细胞位点定位研究。本方法主要包括三个 步骤,首先应用氨基酸疏水值将蛋白质氨基酸序列转换为数字信号,然后利用 信号处理工具一离散小波变换提取凋亡蛋白的时一频特征,最后根据优选的时一 频特征用支持向量机进行模拟预测。对Zhou和Doctor建立的标准数据集 17进 道的方法。由于该方法仅仅基于氨基酸序列就可以对蛋白质结构类进行分类识 别,这将有助于解决当蛋白质结构实验数据缺乏的情况下亚细胞位点的预测问 题。 4.建立了一种膜蛋白类型预测新方法。现有蛋白质亚细胞定位方法针对水 溶性蛋白质而设计,对跨膜蛋白并不适用。本文提出了一种预测膜蛋白结构类 型的新方法。该方法将小波分析技术与支持向量机算法有机结合,利用小波变 换多分辨原理对氨基酸序列进行特征提取,进而将筛选的特征值输入到支持向 量机分类器中用来识别膜蛋白结构类型。数据集中测试结果表明,此方法性能 优于多数文献报道的方法,是一种有效的膜蛋白结构类型预测的方法。 以上蛋白质分类预测技术都已编写了完整的处理程序,可以极为方便地使 用。 关键词:离散小波变换;支持向量机;蛋白质功能;疏水值;分类. U Abstract ABSTRACT Withthesuccessful ofHumanGenomc the completion Project(HGP)andrapid ofmodern science developmentbiologicaland dataare techno

文档评论(0)

yxutcangfp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档