- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--完美WORD文档DOC格式,可在线免费浏览全文和下载,是一篇优秀的毕业设计论文,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考。
上海交通大学硕士论文
蛋白质跨膜结构与二硫键连接模式研究
摘
要
蛋白质二级结构预测是分子生物学中的重要问题。随着
蛋白质序列数据的飞速增长,己知的蛋白质序列和已知的蛋
白质结构之间的差距不断增大,蛋白质结构的预测变得越来
越重要。在蛋白质二级结构中,跨膜蛋白的结构预测非常重
要。跨膜蛋白在生物体中担负着各种各样的重要功能:细胞
的运输,如将营养物质和一些无机电解质输入细胞,而将有
毒的或无用的代谢产物排出细胞;细胞膜内外信号的传递及
能量转换。研究发现,在基因组中,有大约 20%-30%的基因
产物被预测为膜蛋白,这样的比率显示了跨膜蛋白在生物体
中的重要性。此外,在药物研发过程中,膜蛋白偶联受体是
绝大多数药物的作用靶点。膜蛋白的预测研究方法经过几十
年的发展,从最开始的统计方法,到最近十几年大量使用的
智能方法,已经获得很大的提高。
二硫键是由蛋白质的两个半胱氨酸之间配对形成的一
种共价键,可以存在于同一条蛋白质多肽链内,也可以存在
于不同的多肽链之间。对于许多蛋白质而言,二硫键是它们
最终折叠产物的永久特征。二硫键的形成是蛋白质折叠过程
第 I 页
上海交通大学硕士论文
中的重要步骤,其形成动力学影响蛋白质折叠的速率和途
径,它的错误配对是影响蛋白质多肽链正确折叠的重要原
因。二硫键的存在对于维持蛋白质空间结构稳定性,保持其
生理活性具有至关重要的意义。
利用模式识别技术的生物信息学中,要解决蛋白质二硫键
结构连接模式的预测,需要解决如下几个问题:一是如何在
海量的数据集中提取用来作为输入的特征向量;二是如何采
用有效的降维方法降低输入特征向量的维数和冗余;三是使
用怎样的预测工具进行预测。
第一个问题关于提取特征。这项研究从很早以前就已经开
始。从早期蛋白质二级结构预测使用到的疏水性特征、氨基
酸组成成份,到后来使用到的 PSSM 矩阵向量等等。在本文
中,作者结合了 7 组不同的特征向量用于预测蛋白质二硫键
连接模式,它们包括:半胱氨酸偶联、20 种氨基酸组成成份、
半胱氨酸分离距离、半胱氨酸排序、蛋白质分子量、蛋白质
序列长度和蛋白质的二级结构信息。这些向量的总维数 623,
经过 PCA 的降维,维数降低到 300 和 500 维。
第二个问题关于特征降维。经过多年的发展,降维技术已
经非常成熟。现在比较常见的降维方法包括:(1)以主成分分
析(Principle Component Analysis: PCA)为代表的基于重构误
差分析的降维方法;(2)以线性判别分析(Linear Discriminant
Analysis: LDA)为代表的基于类别信息获取最优分类方法的
第 II 页
上海交通大学硕士论文
降 维 方 法 ; (3) 以 独 立 主 元 分 析 (Independent Component
Analysis: ICA) 为 代 表 的 降 维 方 法 ; (4) 以 局 部 线 性 嵌 入
(Locally Linear Embedding: LLE) 和 等 距 映 射 (Isometric
Mapping: Isomap)为代表的基于流形学习的降维方法。本文将
采用 PCA 方法对 623 维向量进行降维。
第三个问题关于预测工具。目前生物信息学中经常使用到
的 预 测 工 具 包 括 : (1) 支 持 向 量 机 技 术 (Support Vector
Machine);(2)人工神经网(Neutral Network);(3)贝叶斯网络
(Bayesian);(4)隐马尔科夫模型(Hidden Markov Model)。本文
使用支持向量机技术中的 SVR,即支持向量回归技术。
论文的主要创新点有以下几点:
对已有的蛋白质二级结构预测算法进行研究,将当前的
预测算法分为基于人工智能的方法和融合方法,完成对以往
方法的综述。同时也对特殊蛋白质结构——膜蛋白预测方法
进行了比较研究;
在蛋白质二硫键连接模式预测中,利用 PCA 降维技术,
对多重序列特征向量和二级结构信息特征向量进行特征降
维,然后将降维后的数据输入 SVR 分类器进行分类,提高了
预测正确率。
关键词:生物信息学、二硫键连接模式、主成分分析、膜蛋
白结构
第 III 页
上海交通大学硕士论文
The research upon prediction methods of Transmembrane Structures
and disulfide connectivity patterns
Abstract
Prediction of Proteins secondary structure is an important issue in the
molecular biology. Wit
您可能关注的文档
最近下载
- 高中数学人教A版(2019)选择性必修第一册知识点归纳含答案.pdf VIP
- 农村污水治理工程施工方案与技术措施.pdf VIP
- 关于马克思主义环境法思想探究.doc VIP
- 越众集团2012年招聘简章.doc VIP
- 酒店装修施工组织设计.doc VIP
- 半导体光电子器件全套教学课件.pptx
- 日语初级~阅读理解.pdf VIP
- 人教版九年级数学第二十四章《圆》单元知识点总结.doc VIP
- 2022-2028全球及中国化学水处理设备行业研究及十四五规划分析报告.docx VIP
- CISSP Official (ISC)2 Practice Tests英文(第3版)考试认证文档p.pdf VIP
文档评论(0)