蛋白质中三联氨基酸数与二级结构数的模型研究 - 厦门大学学报(自然 .pdf

蛋白质中三联氨基酸数与二级结构数的模型研究 - 厦门大学学报(自然 .pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蛋白质中三联氨基酸数与二级结构数的模型研究 - 厦门大学学报(自然

第 48 卷  第 5 期 ( ) Vol . 48  No . 5 厦门大学学报 自然科学版 2009 年 9 月 J our nal of Xiamen U niver sit y (N at ural Science) Sep . 2009 蛋白质中三联氨基酸数与二级结构数的模型研究 朱 尔 一 (厦门大学 化学化工学院 ,现代分析科学重点实验室 ,福建 厦门36 1005) 摘要 :蛋白质的一级结构或序列与二级结构的关系在蛋白质结构研究中是很重要的 ,通过建立模型的方法来研究这种 ( ) 关系. 在文献中已有的模型 蛋白质一级结构中的二联氨基酸与蛋白质二级结构的模型 的基础上 ,建立了蛋白质一级结 构中的三联氨基酸个数与蛋白质二级结构个数模型. 该模型能够较准确地反映蛋白质的一级结构或序列与蛋白质的二 级结构的关系 , 比较适合应用于氨基酸序列长度变化较大的建模数据 , 同二联氨基酸与二级结构模型比较 , 由于三联氨 ( 基酸含有更多氨基酸之间的耦合信息 ,该模型的拟合精度更高. 由于蛋白质一级结构中的三联氨基酸的种类数很大 为 ) ( ) 4 200 ,用以建模的变量数就很大 , 同时从 D SSP 数据库得到的样本量也很大 为 11 600 ,用以建模的数据量很大. 研究 结果表明 ,PL S 变量筛选法是一种建立大数据模型有效的方法 ,可有效地处理变量数为 4 200 ,样本数为 11 600 这样大 数据量的建模问题. 关键词 :蛋白质二级结构预测 ; 偏最小二乘法变量筛选 ; 海量数据建模 ; 三联氨基酸 O 604       A       (2009) 中图分类号 : 文献标识码 : 文章编号 : )   蛋白质的一级结构或序列与二级结构的关系在蛋 虑排列顺序 ,ABC 与 CBA 相同 ,三联氨基酸模型 白质结构研究中是很重要的. 利用蛋白质的一级结构 自变量中包含了更多的氨基酸之间的耦合作用信息 , [ 1 ] 或序列预测蛋白质的二级结构的研究方法 有 Chou 因此三联氨基酸模型或许能更精确地反映蛋白质的序 Fa sman 、GO R 、基于疏水性方法和人工神经网络法等 列与二级结构的关系. 另外 ,三联氨基酸模型中自变量 很多种 ,其中有一类方法是研究蛋白质中20 种氨基酸 数很大 ,建模的过程中容易出现过拟合问题 ,采用一般 数量与二级结构数量的关系的 ,如 Cho uFa sman 法[ 1 ] 多元回归的方法 ,根本无法建模 ,本研究采用偏最小二 α β [3 - 4 ] 是研究 20 种单个氨基酸

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档