- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
蛋白质中三联氨基酸数与二级结构数的模型研究 - 厦门大学学报(自然
第 48 卷 第 5 期 ( ) Vol . 48 No . 5
厦门大学学报 自然科学版
2009 年 9 月 J our nal of Xiamen U niver sit y (N at ural Science) Sep . 2009
蛋白质中三联氨基酸数与二级结构数的模型研究
朱 尔 一
(厦门大学 化学化工学院 ,现代分析科学重点实验室 ,福建 厦门36 1005)
摘要 :蛋白质的一级结构或序列与二级结构的关系在蛋白质结构研究中是很重要的 ,通过建立模型的方法来研究这种
( )
关系. 在文献中已有的模型 蛋白质一级结构中的二联氨基酸与蛋白质二级结构的模型 的基础上 ,建立了蛋白质一级结
构中的三联氨基酸个数与蛋白质二级结构个数模型. 该模型能够较准确地反映蛋白质的一级结构或序列与蛋白质的二
级结构的关系 , 比较适合应用于氨基酸序列长度变化较大的建模数据 , 同二联氨基酸与二级结构模型比较 , 由于三联氨
(
基酸含有更多氨基酸之间的耦合信息 ,该模型的拟合精度更高. 由于蛋白质一级结构中的三联氨基酸的种类数很大 为
) ( )
4 200 ,用以建模的变量数就很大 , 同时从 D SSP 数据库得到的样本量也很大 为 11 600 ,用以建模的数据量很大. 研究
结果表明 ,PL S 变量筛选法是一种建立大数据模型有效的方法 ,可有效地处理变量数为 4 200 ,样本数为 11 600 这样大
数据量的建模问题.
关键词 :蛋白质二级结构预测 ; 偏最小二乘法变量筛选 ; 海量数据建模 ; 三联氨基酸
O 604 A (2009)
中图分类号 : 文献标识码 : 文章编号 :
)
蛋白质的一级结构或序列与二级结构的关系在蛋 虑排列顺序 ,ABC 与 CBA 相同 ,三联氨基酸模型
白质结构研究中是很重要的. 利用蛋白质的一级结构 自变量中包含了更多的氨基酸之间的耦合作用信息 ,
[ 1 ]
或序列预测蛋白质的二级结构的研究方法 有 Chou 因此三联氨基酸模型或许能更精确地反映蛋白质的序
Fa sman 、GO R 、基于疏水性方法和人工神经网络法等 列与二级结构的关系. 另外 ,三联氨基酸模型中自变量
很多种 ,其中有一类方法是研究蛋白质中20 种氨基酸 数很大 ,建模的过程中容易出现过拟合问题 ,采用一般
数量与二级结构数量的关系的 ,如 Cho uFa sman 法[ 1 ] 多元回归的方法 ,根本无法建模 ,本研究采用偏最小二
α β [3 - 4 ]
是研究 20 种单个氨基酸
您可能关注的文档
- 紫外吸收光谱中常用的术语有.ppt
- 稻米蛋白质含量及其影响因素的研究进展 - 中国作物学会.pdf
- 修饰蛋白质组学分离鉴定新技术新方法 - 1809组.pdf
- 棕榈油改性含氟拒水剂的合成及其拒水性能 - 印染.pdf
- 会出现两次染色体排列在细胞中央和两次染色体移向细胞两极.doc
- 左旋棉酚诱导daudi细胞发生自噬的可能机制及 - 第三军医大学学报.doc
- 人巨细胞病毒ie1蛋白功能研究新进展 - 国际生物制品学杂志.pdf
- 淋巴球特性.ppt
- 共沉淀法合成mg-al-类水滑石影响因素研究 - 山东大学学报(理学版).pdf
- 水产品贮藏过程中肌肉蛋白质降解规律的研究进展 - 食品安全质量检测 .pdf
文档评论(0)