蛋白质分子中RNA结合位点的分析和预测-生物化学与分子生物学专业论文.docxVIP

蛋白质分子中RNA结合位点的分析和预测-生物化学与分子生物学专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质分子中RNA结合位点的分析和预测-生物化学与分子生物学专业论文

目录 中文摘要1 Abstract 5 第一章 前言9 1.1 实验方法9 1.1.1 X 射线晶体衍射 9 1.1.2 核磁共振10 1.1.3 其它结构测定方法10 1.2 生物信息学方法10 1.2.1 研究蛋白质中的 RNA 结合域 11 1.2.2 通过各种特征,采用统计分析或者机器学习方法 12 1.2.3 采用分子动力学模拟结合过程 13 1.3 研究现状讨论13 第二章 数据来源15 2.1 蛋白质-RNA 相互作用数据库 15 DB 数据库 15 RBPDB 数据库 15 IDB 数据库 16 NPInter 数据库 17 Rice RBP 数据库 18 2.2 数据来源19 2.3 PDB 数据格式 24 2.4 数据预处理25 2.3 定义与 RNA 相互作用的氨基酸 27 2.4 提取与 RNA 相互作用的氨基酸位点 28 第三章 特征提取31 3.1 氨基酸理化性质31 3.2 pKa 值 33 3.3 氨基酸疏水性数值33 3.4 溶剂可及表面积比例34 3.5 氨基酸所处的二级结构构象38 3.6 PSSM 矩阵 38 3.7 氨基酸的偶极矩与侧链体积39 3.8 特征矩阵构建42 第四章 模型构建与模型性能43 4.1 数据集构建43 4.2 基于 Naivy Bayes 方法构建模型 43 4.3 基于属性 bagging 提高模型性能 44 4.4 模型自身测试性能45 4.5 与其它模型的比较46 4.6 讨论47 4.6.1 结合 RNA 的氨基酸偏好性 47 4.6.2 氨基酸的原子数与结合 RNA 偏好性 47 4.6.3 氨基酸 R 基团极性及静电荷值与结合 RNA 偏好性 48 4.6.4 疏水性数值与结合 RNA 偏好性 49 4.6.5 基于氨基酸的偶极矩与侧链体积的氨基酸分类与结合 RNA 偏好性 50 4.6.6 用于模型构建的特征讨论51 第五章 实例分析53 5.1 Xlrbpa 蛋白 53 5.2 Xlrbpa 蛋白作用位点预测 53 5.3 预测结果分析53 第六章 在线预测服务器构建57 6.1 MATLAB Builder JA 57 6.2 构建任务信息数据库59 6.3 网站简介及使用步骤60 第七章 结论63 参考文献65 文献综述69 论文 75 个人简历85 致谢 87 缩略词表 英文缩写 英文名称 中文名称 dsRBD double-stranded RNA-binding domain 双链 RNA 结合结构域 FFS Forward Feature Selection 前向特征选择 LOOCV Least-One-Out Cross Validation 留一交叉法验证 MATLAB Matrix Laboratory 矩阵实验室软件 MCR MATLAB Compiler Runtime MATLAB 编译环境 PDB Protein Data Bank 蛋白质数据库 PSSM Position-Specific Scoring Matrix 位置特异性得分矩阵 RRM RNA-Recognition Motif RNA 结合结构域 SASA Solvent Accessible Surface Area 溶剂可及表面积 SCOP Structural Classification of Proteins 蛋白质结构分类数据库 SVM support vector machine 支持向量机 TRBP TAR-RNA Binding Protein 转录激活反应 RNA 结合蛋白 PAGE PAGE 13 PAGE PAGE 10 中文摘要 蛋白质与 RNA 的相互作用广泛存在于 RNA 剪切、翻译、病毒的复制以及细 胞中的其它生物学过程中。因此,探讨蛋白质与 RNA 相互作用并确定蛋白质中 与 RNA 结合的氨基酸残基,对于理解蛋白质与 RNA 之间的相互作用机制具有 重要意义。 目前,对这一问题的研究主要从实验与生物信息学两个方面入手。从实验上 看,主要是通过 X 射线晶体衍射、核磁共振等方法得到蛋白质与 RNA 复合物的 三维结构信息。基于三维结构信息进一步确定与蛋白质中与 RNA 相互作用的氨 基酸残基。实验的优点是结果可靠,缺点在于时间和经费方面的花费较大,并且 在具体实施时,还面临着不少实际问题。例如,某些蛋白质-RNA 复合物结晶很 难获得。 随着蛋白质结构数据的增多,研究人员开始尝试从生物信息学角度出发对这 个问题进行研究与分析。从研究途径看,可以分为通过 RNA 结合结构域来判定、 通过分子动力学模拟来判定以及通过统计分析或者机器学习方法来判定这 3 个 方面。对于结构域方法来说,我们

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档