- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关键模体的蛋白质折叠型识别.ppt
蛋白质结构中的关键模体识别及结构预测算法
答辩人:凌彬
指导老师:卜东波 研究员
答辩日期:2014年2月17日
报告提纲
研究背景及国内外研究现状
研究动机及目标
研究内容与成果
总结与展望
研究背景
蛋白质结构预测:从一维序列到三维结构
结构预测方法
同源建模法 归范法 从头预测法
面临的挑战
同源建模法:
超过30%序列等同率的蛋白一般能产生高质量的预测结果
“已经被close了”[Baker,2007]
规范法:
仅能正确识别约2/3远同源的折叠型
从头预测法:
不适宜预测长的、复杂拓扑结构的蛋白质,能量函数不准确,构象搜索效率低
报告提纲
研究背景及国内外研究现状
研究动机及目标
研究内容与成果
总结与展望
现有方法的问题
问题:
远同源蛋白质往往只在部分序列上表现出信号
其他区域信号模糊
研究动机及目标
目标:
识别模板上的关键模体,
基于关键模体设计联配算法,以确定蛋白质的粗拓扑
提高蛋白质折叠型识别率。
关键模体:
模板上结构和序列都高度保守的部分。
报告提纲
研究背景及意义
国内外研究现状
研究目标及框架
研究内容与成果
具有远程关联区域的序列保守性
关键模体的标定算法
基于关键模体的联配算法
总结与展望
远程残基接触(Contact)
Contact示意图
现有归范法的遇到的问题
问题:
联配给出的contact往往有冲突
如何确定哪些contact更可信?
Contact一致性问题
目标:
确定哪些contact具有高可信度。
现有方法:
采用共变信息(Co-evolution)
缺点:需要的同源序列很多(1000条)。
本文方法:
序列保守性
两个具有相互作用的残基对在进化过程中应该表现地相对保守。
多序列联配的Contact一致性
S1和S2上同时为T,则contact一致
S1和S2上一个为T一个为F,则contact不一致
实验采用的数据集
数据集:PFAM-A
优点:人工标注的高质量多序列联配
预处理:
滤除序列等同率70%以上的序列
序列保守性的衡量方法
序列保守性阈值估计
我们分别取0.6、1.0、1.5作为阈值进行探究
Contact距离阈值估计
Contact距离阈值估计
阈值(单位:Å)
4.5
5.0
5.5
具有contact的残基比例
9.8%
24.7%
37.4%
阈值(单位:Å)
4.5
5.0
5.5
具有contact的残基比例
21.53%
37.3%
50.7%
阈值(单位:Å)
4.5
5.0
5.5
具有contact的残基比例
37.5%
49.4%
58.2%
表3-2 (c)侧链中心之间的距离分布
Contact一致性衡量方法
结果分析
观察1:
序列保守性越强,contact一致性越高
表3-3 Contact阈值4.5Å两端均保守的情形
结果分析
观察2:
序列保守部分比序列不保守部分的contact一致性高
表3-5 Contact阈值4.5Å两端均不保守的情形
下图所示为contact不一致的情况
实例分析
实例分析
启示:应该放松contact距离阈值
观察:Contact一致性显著提升
结果分析
表3-6 Contact阈值放松后两端均保守的情形
表3-8 Contact阈值放松后两端均不保守的情形
改进
残基的contact 二级结构之间的contact
α螺旋:考察其序列距离为4的邻域
β平面:考察其序列距离为2的邻域
Coil: 则不考察
结果分析
表3-9 考虑邻居的Contact两端均保守的情形
表3-11考虑邻居的Contact两端均不保守的情形
观察:Contact一致性得到进一步的提升
结论
序列保守性越强,contact一致性越高
序列保守部分的二级结构片段之间的contact更可信
报告提纲
研究背景及意义
国内外研究现状
研究目标及框架
研究内容与成果
具有远程关联区域的序列保守性
关键模体的识别算法
基于关键模体的联配算法
总结与展望
关键模体的定义
结构保守:
在进化中,结构表现的比序列更保守。
序列保守:
从蛋白质结构预测算法的角度来看,只有序列信号强,有利于我们进行准确联配的区域才能提供稳定的三维约束。
同源蛋白质组的构建
方法:
以某个蛋白质结构为seed从结构库里找出与seed为同源的蛋白质。
工具:TMalign[Y. Zhang2005]
标准:TMscore 0.55时为同源
问题:并不是真正意义上的同源蛋白质
方法一:整数线性规划
目标:
求解序列保守结构也保守的部分
双目标 单目标近似:
把其中一个目标反映在约束部分,在这个约束条件下去优化另一个目标。
如序列保守性大于一定的阈值作为约束,
您可能关注的文档
最近下载
- 3#T8030-25U塔吊安拆施工方案.docx VIP
- 《临床研究协调员(CRC)从业能力要求》(TZJPA 001-2024).pdf VIP
- 《北美国际护理诊断定义与分类(2021-2023)》修订解读.pptx VIP
- 规范《DGJ32J33-2006-江苏省建筑安装工程施工技术操作规程-地面工程》.pdf VIP
- 《智能网联汽车概论(活页式)》全套教学课件.pptx
- ABB机器人通讯介绍.pptx VIP
- DB32╱T 3839-2020 水闸泵站标志标牌规范.docx
- Word页眉页脚模板06.docx VIP
- 04J008挡土墙图集标准.pdf
- QC成果-提高大型储罐现场防腐质量验收一次合格率.pdf VIP
文档评论(0)