ChIP-Seq综述.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ChIP-Seq综述

ChIP-Seq综述 简介 ChIP-Seq:用于在全基因组范围中研究DNA结合蛋白(相互反应)、组蛋白修饰(表观遗传标记)和核小体的技术,研究这三个主题可有助于了解基因之间的相互调控以及染色体的功能结构。 ChIP-Seq实验原理:示意图为Fig.1和Fig.2. 在生理状态下,把细胞内的DNA与蛋白质交联(Crosslink)后裂解细胞,分离染色体,通过超声或酶处理将染色质随机切割,利用抗原抗体的特异性识别反应,将与目的蛋白相结合的DNA片段沉淀下来,再通过反交联(Reverse crosslink)释放结合蛋白的DNA片段,最后测序获得DNA片段的序列。 注意:当研究重点是得到核小体的位置和组蛋白修饰的位置的时候,实验中并不首先进行crosslink,而是用超声或者MNase直接进行打断,优先使用MNase,可以更高效地去除掉linker DNA片段以得到核小体更为精确的位置。 Fig.1 Fig.2 ChIP-Seq的优势:1. 具有碱基层面的分辨率;2.不会有ChIP-chip中由DNA片段杂交导致的噪音,GC含量、片段长度、片段浓度以及耳机结构都会对杂交造成影响;3.ChIP-chip中的微阵列信号不是线性增长的,其所测量的范围有限。4. 由于在设计array时,探针的数量、种类有限,当coverage比较高的时候无法准确测量,也无法发现新的序列。 ChIP-Seq与ChIP-chip的比较见Fig.3. Fig.3 实验设计的关键 抗体质量:一个灵敏度高和特异性高的抗体可以得到富集的DNA片段,这有利于探测结合位点。 样本量:Illumina,10-50ng DNA,需要用PCR进行扩增的轮数也比较少,因而由PCR导致的偏差比较小 空白对照:空白对照是必要的,存在很多假阳性情况,举例:1. 开放的染色体区域更容易被打断成片段,这样导致tag数在基因组上的分布是不均匀的;2.很多重复序列会使做map的时候得到结果难以解释。空白对照的用途:可以判断由ChIP-Seq得到的peak时候具有统计上的显著性。 三种类型的空白对照:1.部分进行免疫共沉淀前的DNA(input DNA),这是最常用的;2.由免疫共沉淀得到而不含有抗体的DNA(mock IP DNA),使用这个的一个问题是收集到的量可能不够;3.使用非特异免疫共沉淀方法得到的DNA. 测序深度:在发表的ChIP-Seq实验中,一般使用Illumina Genome Analyzer上一个lane产生的数据作为一个基本单位,目前一个lane大概是8-15million reads(2009数据)。判断足够的测序深度的标准是:当增加测序,得到更多的reads的时候不能发现更多的东西。应该这一准则到结合位点的数量上就是:进行测序,增加reads数而无法得到更多的结合位点。 关于测序深度饱和曲线的讨论见:Kharchenko, P.V., Tolstorukov, M.Y. Park, P.J. Design and analysis of ChIP-seq experiments for DNA-binding proteins. Nature biotechnology 26, 1351-1359 (2008). 饱和曲线示例: Multiplexing:对于基因组比较小的物种(E.coli,C.elegans)来说,一个标准的illumina lane得到的数据太多了,仅仅用于测一个样本比较浪费,所以可以多个样本加不同的adapter放在一起测。 数据分析概述 1. 数据分析的概述如下图: 2. ChIP-Seq的主要特征 2.1. “好”数据的特征: 1). 与非特异性的染色体背景相比,从研究目标上得到了足够的DNA片段; 2). 测序文库很全,基本包含了所有的想要研究的片段(是不是测序深度足够的意思呢?)。 “好”数据的数据量:2-20million mapped reads 2.2. Mapped reads是转换成基因组上每个碱基上的reads数,称为tags。 2.3. 信号值高的位点(tags多的区域)并不总是且不是唯一有生物学意义的信号,中等信号被认为更可靠。 2.4. ChIP-Seq的reads的背景分布常常由空白对照经验拟合得到,一些算法也可以根据数据本身而不用controls得到。 3.三种主要数据分布类型 不同类型的蛋白或者组蛋白修饰会得到不同的峰形。下图中给出了常见的。CTCF: sharp binding sites; RNA polymerase II: a mixture of shapes; H3K36me3: medium size broad peaks; large domains: H3K27me3. 上述峰形的另一种

文档评论(0)

xjj2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档