基于关键模体的蛋白质折叠型识别.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关键模体的蛋白质折叠型识别.ppt

蛋白质结构中的关键模体识别及结构预测算法 答辩人:凌彬 指导老师:卜东波 研究员 答辩日期:2014年2月17日 报告提纲 研究背景及国内外研究现状 研究动机及目标 研究内容与成果 总结与展望 研究背景 蛋白质结构预测:从一维序列到三维结构 结构预测方法 同源建模法 归范法 从头预测法 面临的挑战 同源建模法: 超过30%序列等同率的蛋白一般能产生高质量的预测结果 “已经被close了”[Baker,2007] 规范法: 仅能正确识别约2/3远同源的折叠型 从头预测法: 不适宜预测长的、复杂拓扑结构的蛋白质,能量函数不准确,构象搜索效率低 报告提纲 研究背景及国内外研究现状 研究动机及目标 研究内容与成果 总结与展望 现有方法的问题 问题: 远同源蛋白质往往只在部分序列上表现出信号 其他区域信号模糊 研究动机及目标 目标: 识别模板上的关键模体, 基于关键模体设计联配算法,以确定蛋白质的粗拓扑 提高蛋白质折叠型识别率。 关键模体: 模板上结构和序列都高度保守的部分。 报告提纲 研究背景及意义 国内外研究现状 研究目标及框架 研究内容与成果 具有远程关联区域的序列保守性 关键模体的标定算法 基于关键模体的联配算法 总结与展望 远程残基接触(Contact) Contact示意图 现有归范法的遇到的问题 问题: 联配给出的contact往往有冲突 如何确定哪些contact更可信? Contact一致性问题 目标: 确定哪些contact具有高可信度。 现有方法: 采用共变信息(Co-evolution) 缺点:需要的同源序列很多(1000条)。 本文方法: 序列保守性 两个具有相互作用的残基对在进化过程中应该表现地相对保守。 多序列联配的Contact一致性 S1和S2上同时为T,则contact一致 S1和S2上一个为T一个为F,则contact不一致 实验采用的数据集 数据集:PFAM-A 优点:人工标注的高质量多序列联配 预处理: 滤除序列等同率70%以上的序列 序列保守性的衡量方法 序列保守性阈值估计 我们分别取0.6、1.0、1.5作为阈值进行探究 Contact距离阈值估计 Contact距离阈值估计 阈值(单位:Å) 4.5 5.0 5.5 具有contact的残基比例 9.8% 24.7% 37.4% 阈值(单位:Å) 4.5 5.0 5.5 具有contact的残基比例 21.53% 37.3% 50.7% 阈值(单位:Å) 4.5 5.0 5.5 具有contact的残基比例 37.5% 49.4% 58.2% 表3-2 (c)侧链中心之间的距离分布 Contact一致性衡量方法 结果分析 观察1: 序列保守性越强,contact一致性越高 表3-3 Contact阈值4.5Å两端均保守的情形 结果分析 观察2: 序列保守部分比序列不保守部分的contact一致性高 表3-5 Contact阈值4.5Å两端均不保守的情形 下图所示为contact不一致的情况 实例分析 实例分析 启示:应该放松contact距离阈值 观察:Contact一致性显著提升 结果分析 表3-6 Contact阈值放松后两端均保守的情形 表3-8 Contact阈值放松后两端均不保守的情形 改进 残基的contact 二级结构之间的contact α螺旋:考察其序列距离为4的邻域 β平面:考察其序列距离为2的邻域 Coil: 则不考察 结果分析 表3-9 考虑邻居的Contact两端均保守的情形 表3-11考虑邻居的Contact两端均不保守的情形 观察:Contact一致性得到进一步的提升 结论 序列保守性越强,contact一致性越高 序列保守部分的二级结构片段之间的contact更可信 报告提纲 研究背景及意义 国内外研究现状 研究目标及框架 研究内容与成果 具有远程关联区域的序列保守性 关键模体的识别算法 基于关键模体的联配算法 总结与展望 关键模体的定义 结构保守: 在进化中,结构表现的比序列更保守。 序列保守: 从蛋白质结构预测算法的角度来看,只有序列信号强,有利于我们进行准确联配的区域才能提供稳定的三维约束。 同源蛋白质组的构建 方法: 以某个蛋白质结构为seed从结构库里找出与seed为同源的蛋白质。 工具:TMalign[Y. Zhang2005] 标准:TMscore 0.55时为同源 问题:并不是真正意义上的同源蛋白质 方法一:整数线性规划 目标: 求解序列保守结构也保守的部分 双目标 单目标近似: 把其中一个目标反映在约束部分,在这个约束条件下去优化另一个目标。 如序列保守性大于一定的阈值作为约束,

文档评论(0)

wangxing1张 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档