【生物信息学第版】计算表观遗传学.ppt

  1. 1、本文档共145页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【生物信息学第版】计算表观遗传学

差异甲基化区域的识别QDMR 导入甲基化数据 定量甲基化差异 筛选差异甲基化区域 定量差异甲基化区域的特异性 导出分析结果 使用流程 导入甲基化数据 目前QDMR只接受txt文件 浏览本地甲基化数据文件 例子甲基化数据 数据中最大的甲基化值 物种信息 区域列信息 样本开始的列 甲基化数据预览 定量甲基化差异 熵表示甲基化差异的大小,熵越小表示各样本间的甲基化差异越大 通过点击上面的某一行,来查看相应区域在各样本中的甲基化值 识别差异甲基化区域 根据生物学研究的要求选择合适的筛选差异甲基化区域的阈值 软件自动筛选差异甲基化区域和非差异甲基化区域 差异甲基化区域 非差异甲基化区域 差异甲基化区域的样本特异性 利用绝对特异性CS表示差异甲基化区域在各样本中的甲基化特异性, 大于0表示特异高甲基化,小于0表示特异低甲基化,等于0表示无特异性 结果统计及差异甲基化区域分布 QDMR筛选结果统计 差异甲基化区域在相应物种各染色体上的分布图 可以右击设置保存该图 导出结果及后继分析 QDMR的帮助文档 简洁的软件用户指南 /qdmr/ QDMR的应用举例 应用QDMR筛选并分析人类16个组织间的差异甲基化区域; DNA甲基化数据; MeDIP测定的人类16个组织中全基因组的DNA甲基化数据; 利用QDMR筛选组织差异甲基化区域。 应用QDMR定量人类组织间甲基化差异; 熵越小的区域拥有更大的甲基化差异。 结果1:定量的组织间甲基化差异 各基因组区域呈现不同的组织间甲基化差异; CpG岛拥有较小的甲基化差异; 低CpG密度启动子呈现较大的甲基化差异。 CpG密度呈双峰分布;甲基化差异依赖于CpG密度 结果2:人类组织间差异甲基化区域 应用QDMR共筛选人类16个组织间的差异甲基化区域10651个;非差异甲基化区域; 且这些差异甲基化区域显著富集组织分化相关的功能 结果3:差异甲基化区域的组织特异性 各组织中均有特异甲基化的T-DMR;且分布不均匀; 特异低甲基化T-DMR和特异高甲基化T-DMR在各组织的分布也不尽相同。 CD4+T细胞特异低甲基化T-DMR与激活型组蛋白修饰相关; CD4+T细胞特异高甲基化T-DMR与抑制性组蛋白修饰相关。 * ChIP–SAGE ChIP–Seq (二)分析基因组范围的组蛋白修饰数据 1. 高通量组蛋白修饰分析工具 Tiling Array TileMap 基于模型的瓦式芯片分析算法(model-based analysis of tiling–array algorithm, MAT)。 ChIP-Seq CisGenome MACS 2. 组蛋白修饰峰值探测 与其他基于ChIP的高通量技术一致的是,从ChIP-Seq标签数据鉴别出可靠的组蛋白修饰谱,等价于寻找一段基因组区域内的统计学显著的组蛋白修饰标签的峰。 一个最直接的想法是,对于一段长度一定的基因组区域来说,包含R个序列标签可以从统计学水平支持这段区域被组蛋白修饰所定位。 一般原理 构造背景分布: 泊松分布 例:人类基因组gsize=3.0E9*0.8=2.4E9 窗宽w 基因组期望的标签数(CD4+ T细胞H3K9me3) 求 使 0.01 当R=3时,p=0.0021,满足要求。所以,以w为窗宽,将基因组打碎,以d为步长,移动窗口,找出满足大于3个标签的窗口,合并后即为组蛋白修饰H3K9me3定位区域。 三、组蛋白修饰与其他表观遗传修饰的协同调控 (一)DNA甲基化和组蛋白修饰的相互作用 (二)通过贝叶斯网络重构表观遗传修饰协同调控基因表达网络 四、组蛋白修饰异常与人类疾病 (一)异常组蛋白修饰模式与癌症 (二)组蛋白修饰与其他疾病 (三)食品营养与组蛋白修饰 第四节 基因组印记 Section 4 Genomic Imprinting 一、基因组印记是表观遗传现象 基因组印记是在母本和父本之间产生功能性区别并在哺乳动物发育与生长中起重要作用的一种表观遗传学机制。 二、基于生物信息学方法识别新印记基因 目前实验测得印记基因的主要方法是利用DNA甲基化和基因表达分析基因的印记情况,只关注染色体的一小段区域。由于基因的单等位表达可能只发生在特定亚型、组织或发育阶段,所以实验确定印记基因面临很多问题。 主要预测印记基因的方法是用机器学习方法基于基因的序列特征预测全基因组印记基因。 常用的模式识别方法 支持向量机(SVM) 径向基神经网络(RBF)

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档