- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
检测远程同源蛋白质 - 东南大学生物电子学国家重点试验室
第七章-2 蛋白质结构预测 主讲人:孙 啸 制作人: 刘志华 东南大学 吴健雄实验室 第四节 蛋白质三维结构预测 1、同源模型化方法 主要思想: 对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。 依据: 任何一对蛋白质,如果两者的序列等同部分超过30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。 假设待预测三维结构的目标蛋白质为U(Unknown),利用同源模型化方法建立结构模型的过程包括下述6个步骤: (1)搜索结构模型的模板(T) (2)序列比对 (3)建立骨架 (4)构建目标蛋白质的侧链 (5)构建目标蛋白质的环区 (6)优化模型 构建目标蛋白质的侧链 预测结果准确率: 对于具有60%等同的序列,用上述方法所建立的三维模型非常准确。若序列的等同部分超过60%,则预测结果将接近于实验得到的测试结果。 一般如果序列的等同部分大于30%,则可以期望得到比较好的预测结果。 2、线索化方法(折叠识别方法) 有很多蛋白质具有相似的空间结构,但它们的序列等同部分小于25%,即远程同源。 对于这类蛋白质,很难通过序列比对找出它们之间的关系,必须设计新的分析方法。 对于一个未知结构的蛋白质(U), 如果找到一个已知结构的远程同源蛋白质(T), 那么可以根据T的结构模板通过远程同源模型化方法建立U的三维结构模型。 一个远程同源模型化方法要解决三个问题: (1)检测远程同源蛋白质(T); (2)U和T的序列必须被正确地对比排列; (3)修改一般的同源模型化过程,以应用于相似度非常低的情况,即处理更多的环区,建立合理的三维结构模型。 如何解决第一个和第二个问题? 基本思想是建立一个从U到已知结构T的线索,并通过一些基于环境或基于知识的势,评价序列与结构的适应性。 至于最后建立三维结构模型则是非常困难的 线索化的主要思想: 利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。 建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。 线索化或者折叠识别的目标是为目标蛋白质U寻找合适的蛋白质模板,这些模板蛋白质与U没有显著的序列相似性,但却是远程同源的。 线索化方法一般有5个基本组成部分: (1)已知三维折叠结构的数据库; (2)一种适合于进行序列-结构比对的三维折叠信息的表示方法; (3)一个序列-结构匹配函数,该函数对匹配程度进行打分; (4)建立最优线索的策略,或者是进行序列-结构比对的策略; (5)一种评价序列-结构比对显著性的方法。 假设存在有限数目的核心折叠(core folds) 核心折叠实际上是构成蛋白质空间形状的基本模式。 建立核心折叠数据库 预测---- 建立线索 一种基于序列与结构比对的最优线索化算法 令: s1, s2,…, sn为蛋白质序列S的n个元素 C1, C2,…, Cm为数据库中核心折叠C的m个核心区域 Cij为第i个核心区域第j个氨基酸位置 每一个核心区域由若干个氨基酸残基构成 设t是一个从序列到核心折叠的线索,那么t说明了序列S的哪些元素si,sj,sk,…代表核心区域C1, C2, C3,…的起始位置。 这实际上是一种从序列S到核心折叠C的比对 令?代表核心折叠C中的环到序列S中空位的映射,显然?是通过线索化而确定的。 令f(t)是进行比对的得分函数,其定义如下: f(t) = g1 (v,t) + g2 (u,v,t) + g3 (?,t) g1 (v,t) 评价氨基酸残基v所处的位置 g2 (u,v,t) 评价残基u和v的相对位置,如果u和v 键合,则得分高; g3 (?,t)评价环区,根据环区的大小进行打分。 线索化问题: 对于给定的序列S和核心折叠C,选择一个线索t,使得f(t)的值最小,即寻找一个从S到C的最佳映射。 3、从头预测方法 在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法,即(直接)仅仅根据序列本身来预测其结构。 从头预测方法一般由下列3个部分组成: (1)一种蛋白质几何的表示方法 由于表示和处理所有原子和溶剂环境的计算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似处理。 (2)一种势函数及其参数 通过对已知结构的蛋白质进行统计分析确定势
您可能关注的文档
- 最小的区分了词和短语.ppt
- 有限差分法对不同润滑介质下静压气体轴颈轴承性能研究.pdf
- 期刊杂志判断文课的标准.ppt
- 未就业内生源毕业生回原籍就业.doc
- 未通过信息平台申报补贴的并网发电项目情况第六批.doc
- 智慧教室操作指引2016102- 浙江师范大学.ppt
- 本文课摘自第十三届国际无我茶会暨国际茶文化课论文集—许伟庭 .doc
- 本课课内容.pdf
- 本科生大创答辩稿陈绍坤组.ppt
- 机关事业单位基金征缴大讲堂 - 绵阳社会保险事业管理局.ppt
- 6.20正面战场的抗战课件--2024-2025学年统编版八年级历史上册.pptx
- 1.2+ 原始农业与史前社会++课件+++2024-2025学年统编版七年级历史上册.pptx
- 6.21+敌后战场的抗战+课件--2024-2025学年统编版八年级历史上册.pptx
- TFSI079-2022 1,3,5-三[(3,3,3-三氟丙基)甲基]环三硅氧烷发布稿.pdf
- TXJY2201-2023 湖南辣椒 烘干技术规程.pdf
- 北师大《中级无机化学》讲义 第六章 固体无机化学.ppt
- 人教高中化学选择性必修一讲义 第四章 化学反应与电能.pptx
- 《会计电算化》课程课件.ppt
- 新人教版道德与法治七年级上册第三课第二框-做更好的自己课件.pptx
- 年仁爱版八年级英语下册Unit-5-Topic-2-Section-C课件.ppt
最近下载
- 在线网课学习课堂《学术英语(华理 )》单元测试考核答案.pdf
- GB∕T 9755-2014_合成树脂乳液外墙涂料.pdf
- AQ-T 3033-2022 化工建设项目安全设计管理导则.docx
- 世界洋流空白图.doc VIP
- 水利行业廉政风险防控手册(试行) 工程建设管理分册.pdf VIP
- 2023年江苏二建继续教育(机电工程)题库(含答案).pdf VIP
- 2024年上海银行股份有限公司校园招聘考试试题带答案.docx
- 山东师范大学《文学理论专题》期末考试复习题及参考答案.doc
- IEEE 1188-2005推荐用于站用阀控铅酸蓄电池的维护、测试和更换方法.pptx VIP
- 2024年时事政治点题库选择题300道精品(完整版).docx
文档评论(0)