蛋白质超家族模体特征分析和超家族识别.pdfVIP

蛋白质超家族模体特征分析和超家族识别.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质超家族的模体特征分析与超家族的识别 摘要 模体是蛋白质进化过程中的保守区域,并一F1.能够反映蛋白质超家族之间亲缘关系,它们 通常对蛋白质的功能起重要作用。因此,蛋白质超家族的模体特征分析及蛋白质超家族的识 别对研究蛋白质结构和功能具有重要意义。本文以蛋白质超家族中的模体和序列为研究对象, 用生物统计学和生物数学中的方法,从蛋白质超家族中的模体功能特征分析及相对位置分布 统计、信息特征提取和蛋白质超家族识别这三个方面进行了研究。主要研究工作概括如下: 首先,从蛋白质结构分类数据库(stoP)中选I叶{16个具有代表性的蛋白质超家族,构建 搜索工具,提取了所构建的数据库的序列模体及模体的位置信息和功能信息,并对其进行整 合;进一步分析了超家族中模体的结构和功能特征,统计分析了模体相对于序列N端和c端 的位置分布及模体出现的频次,结果发现:在含有一种或是多种类型模体的蛋白质超家族中, 模体在序列中的位置分布均呈现一‘定的规律性。本文统计和分析的模体特征以及模体的位置 保守性规律能为蛋白质超家族的识别和蛋白质相互作用网络的建立提供有力帮助。 其次,用生物统计学中的单冈素方差分析方法,对16个具有代表性的蛋白质超家族的氨 基酸组分、物理化学性质分类特征及其组合特征等进行均值检验,提取出具有差异显著性的 特征。此方法不仅有效地降低了特征向罩的维数,而且为蛋白质超家族识别提供了新的参数。 另外,还统计了已知功能的模体和基于统计意义发现的模体在符个超家族中出现的频数。本 文定义的模体频数首次作为’+种新的特征被用于蛋h质超家族的识别。 最后,以下三种方法所选取的参数用于蛋白质超家族的识别:1.将数据库中超家族的20 个氨基酸组分、400个二肽组分、亲疏水特征、物理化学特征以及这些特征的组合输入到最 小离散增量算法中,对蛋白质超家族进行预测:2.以具有统计显著性的特征及其组合特征作 为新参数模式进行了预测;3.将模体频数和具有差异显著性的特征参数模J=℃结合,形成新的 参数模式输入算法完成预测。对比以上三种方法,发现使用多参数组合信息较单参数信息所 得预测精度最高。相对第一种参数选取方法,具有统计显著性特征的参数预测结果较好,并 能有效降低特征向量的维数。第三种方法在选取了显著特征的前提下结合模体频数进行预测, 其中以400+M为参数模式进行预测时结果最好,全伍、全p、邮和a+p蛋白质结构类中超 取的参数进行预测的结果相比,总体预测精度提高了约10%。 关键词:蛋白质超家族;模体特征;模体相对位置分布;模体频数;单因素方差分析;最小 离散增量 Ⅱ ofConservativeMotifFeaturesoftheProtein Analysis andtheTheoreticalfor Superfamilies prediction Protein Superfamilies Abstract TheconservativemotifsCallreflectthe of geneticrelationshipprotein an rolein identificationofthe usuallyplayimportant function.Thus,thc protein proteinsuperfamily becomes for function this biostatisticsand increasingly protein dissertation,the important study.In biomathe

文档评论(0)

tkhyxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档