RNA二级结构预测及其在液体活检中的应用.pdfVIP

  • 66
  • 0
  • 约19.69万字
  • 约 136页
  • 2021-02-04 发布于江西
  • 举报

RNA二级结构预测及其在液体活检中的应用.pdf

摘 要 摘 要 RNA 分子可以呈现出大量复杂的结构,其与蛋白质的结合进一步促成了更加 复杂的三维结构复合体。准确探测RNA 的二级结构及其与蛋白质之间的相互作用 可以帮助我们深入了解RNA 在基因表达、可变剪切、翻译效率以及降解速率等方 面的调控机制;RNA 分子的异常调控可能会直接或间接地改变细胞命运甚至导致 疾病的发生,因此探究RNA 在癌症发生发展中的作用对于临床诊断和治疗都具有 重要意义。 随着RNA 结构重要性的揭示,能够预测碱基配对关系的各种 RNA 二级结构 预测软件被陆续开发出来,然而其准确度通常很低。基于化学小分子修饰或酶切方 法的高通量实验技术可以探测细胞内RNA 真实的单双链状态,但是具体的碱基配 对关系却无从得知。鉴于此,我们开发了RME 算法。该算法针对不同的实验类型 分别构建统计模型以拟合其数据分布,然后通过贝叶斯后验概率模型来推测每个 碱基与其他各碱基的配对概率。RME 算法不仅可以实现不同种类的高通量测序数 据之间的横向比较,其更为重要的意义是从实验数据中提取可靠的碱基配对概率 信息来辅助计算机预测从而获得高准确度的RNA 二级结构。 RNA 结合蛋白(RBP )几乎决定了细胞中所有RNA 分子的命运,RBP 之间也 会通过协同或拮抗作用形成复杂的转录后调控网络,越来越多的组学实验的发展 使该网络的探究成为可能。为此,我们收集了各类CLIP-seq 数据,利用非负矩阵 分解的方法对于不同RBP 在 RNA 上的结合位点进行模糊聚类分析,进而得到功 能上具有协同调控作用的各类RBP 群组,该方法有助于更好地解释 RNA 上的调 控元件所负责的生物学功能。 随着体液中各类非细胞游离RNA (exRNA )的发现,exRNA 作为癌症诊断及 预后标志物的探究越来越多。为了更好地提取exRNA 稀疏的碎片化数据所蕴含的 生物学信息,我们定义了新的结构域(domain )特征并通过机器学习的算法寻找可 靠的癌症诊断及分型的RNA 标志物。 综上,本论文的研究既包括了基础机制研究,也涉及了癌症临床应用:即RNA 二级结构预测算法的优化、RBP 调控网络的搭建以及液体活检中可靠RNA 分子标 志物的鉴定这三部分内容。 关键词:RNA 二级结构预测;RNA 结合蛋白;液体活检;生物标志物;机器学习 I 目 录 目 录 第1 章 前言 1 1.1 问题的提出 1 1.2 选题背景及意义 2 1.2.1 RNA 二级结构预测的背景及意义 2 1.2.2 鉴定RNA 结合蛋白组合调控的RNA 元件 2 1.2.3 寻找液体活检标志物的研究背景及意义 3 1.3 文献综述 4 1.3.1 RNA 二级结构的实验测定方法 4 1.3.2 RNA 二级结构的预测方法 8 1.3.3 RBP 相关的实验方法和计算方法 14 1.3.4 液体活检 23 1.3.5 exRNA 的稳定性 27 1.3.6 不同类型的exRNA 分子标志物 29 1.3.7 片段化exRNA 及其临床应用 32 1.3.8 液体活检分析方法 33 1.4 论文结构 37 第2 章 通过实验数据提高RNA 二级结构预测准确度 38 2.1 数据来源及处理 38 2.1.1 已知的RNA 二级结构数据库 38 2.1.2 RNA 二级结构实验数据 39 2.2 实验仪器 41 2.3 实验方法的开发 41 2.3.1 RME 的整体流程 41 2.3.2 RNA 二级结构实验数据的概率建模 42 2.3.3 SHAPE 数据的概率建模 43 2.3.4 DMS-seq 数据的概率建模 44 2.3.5 PARS 数据的概率建模 46 2.3.6 将后验概率

文档评论(0)

1亿VIP精品文档

相关文档