- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DNA结合蛋白的分析和预测 目录 引言 DNA结合蛋白 数据分析与编码方式 结果讨论 展望 引言 DNA是一切细胞的基本遗传物质 互补的多聚核苷酸链 氢键配对 右手双螺旋结构 高度特异性 信息载体 引言 基因表达如何开关? 目录 引言 DNA结合蛋白 数据分析与编码方式 结果讨论 展望 DNA结合蛋白 DNA分子可以以不同的形式存在。 功能不同. 识别一定的DNA序列并通过固定在某个作用位点上的DNA结合蛋白来调控的,这种蛋白质称为序列特异性DNA结合蛋白质(sequence-specific DNA-binding proteins)。 DNA结合蛋白 DNA的复制、重组、链裂解、转录 细胞周期中染色体的一系列变化 特异识别的分子机制 调控作用 DNA结合蛋白 几种有显著特征的结构类型: 螺旋-转折-螺旋型结构域(helix-turn-helix motif) 锌指型结构域(zinc-finger motif) 亮氨酸拉链型结构域(leucine-zipper motif) 螺旋-连接-螺旋型结构域(helix-loop-helix motif) β折叠型结构域(β-sheet motif) ………… Helix-turn-helix motif Zinc-finger motif Leucine-zipper motif Leucine-zipper motif DNA结合蛋白 DNA与蛋白的结合机制对于细胞功能是至关重要的,然而这种机制人们并没有理解清楚。 因此要通过已有的数据来分析DNA结合域与蛋白质序列组成、可溶性(solvent accessibility)及二级结构之间的关系。 利用这种关系,在SVM的基础上结合非冗余转录因子数据库(non-redundant databases of transcription factors)和 DNA-蛋白质络合物(protein–DNA complex)进行建模,来预测 DNA结合蛋白和结合残基(binding residues)。 目录 引言 DNA结合蛋白相关概念和定义 数据分析与编码方式 结果讨论 展望 定义 结合残基(binding residues): 一个蛋白质序列中的氨基酸残基,如果它的侧链 (side chain) 或中心原子(backbone atoms)与任何一个与之结合的DNA中的原子在3.5?距离范围之内,那么这个残基就叫做“结合残基”。 结合片断(binding segments) : 如果蛋白质片断中心残基的任一原子距离DNA上任一原子小于3.5?,那么这个片断即“结合片断” 定义 结合概率(binding probability):对组成为 i 的片断, 有 Ri 个与DNA结合,则相应的结合概率的分布由 100*(Ri/ΣRi) 给出。 所用数据库 本文所用数据均从PDB (Protein Data Bank)库中获取。 PDNA-62: 从PDB中提取的典型的DNA-蛋白质络合物的数据库。 在pdb库中输入关键字 ”protein-DNA complex”查询,然后去掉与 PDNA-62 中重合部分,经整理得到的259个络合物数据。 目录 引言 DNA结合蛋白 数据分析与编码方式 结果讨论 展望 数据分析及编码方式 PDB格式文件可以用 WebViewer 软件打开,浏览DNA-蛋白质络合物的三维空间构型;也可以用文本编辑软件EditPlus打开,得到如下图所示的原子的详细信息。 数据分析及编码方式 对本文研究有用的数据为:原子序列号、原子名称、残基名称、残基序列号、原子的三维坐标。 在 TurboC2.0 环境下编写程序,读取每一个原子的信息,然后再根据如前所述定义,计算出任一可能结合的残基。 提取出结合残基的信息后,将片断中的每个残基用20位的二进制数表示,然后构成一个100位的五残基片断。 分别用1和-1来表示结合与非结合情况。 目录 引言 DNA结合蛋白 数据分析与编码方式 结果讨论 展望 结果讨论 传统编码方式预报结果: 首先将PDNA-62中的42个络合物分子作为训练集,对剩余的20个分子构成的测试集做预报。其中结合情况的预报准确率偏低,这可能是与训练集的选取范围过于狭窄所造成。 其次用PDNA-62中所有的62个络合物分子作为训练集,对PDB库中其余的DNA-蛋白质络合物分子进行预报。由于涵盖面较上种情况更广一些,所以其预报结合的准确率比上表有显著的改进。 结果讨论 在上述传统编码方式的基础上,尝试用概率差思想进行编码。 Pi(b)=∑bi/∑B Pi(n)=∑ni/∑N ⊿p= Pi(b)-Pi(n) 即统计片断某一位置上每种残基结合与非结合的概
您可能关注的文档
- 大眼美人化妆篇.ppt
- 手机按键模具设计指南.ppt
- 唐总-企业文化-2010,12,17.ppt
- CEGH低压无功补偿.ppt
- 提高原油采收率原理(EOR)第六章-B.ppt
- 病历书写与实习注意事项.ppt
- 国际贸易_第16章_国际贸易与经济增长.ppt
- 做幸福的自己-压力与情绪管理 学员版.ppt
- 自由搭配词汇错误.ppt
- 第13章_水泥混凝土路面.ppt
- 金融产品2024年投资策略报告:积极适应市场风格,行为金融+机器学习新发现.pdf
- 交运物流2024年度投资策略:转型十字路,峰回路又转(2023120317).pdf
- 建材行业2024年投资策略报告:板块持续磨底,重点关注需求侧复苏.pdf
- 宏观2024年投资策略报告:复苏之路.pdf
- 光储氢2024年投资策略报告:复苏在春季,需求的非线性增长曙光初现.pdf
- 公用环保2024年投资策略报告:电改持续推进,火电盈利稳定性有望进一步提升.pdf
- 房地产2024年投资策略报告:聚焦三大工程,静待需求修复.pdf
- 保险2024年投资策略报告:资产负债匹配穿越利率周期.pdf
- 政策研究2024年宏观政策与经济形势展望:共识与分歧.pdf
- 有色金属行业2024年投资策略报告:新旧需求共振&工业原料受限,构筑有色大海星辰.pdf
文档评论(0)