- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于ChIPseq数据HMM方法识别全基因组的差异组蛋白修饰位点.doc
基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点
摘要
目的:表观遗传修饰是调控基因表达和基因组功能的一个主要因素。在不同的表观遗传修饰中,差异组蛋白修饰位点(DHMSs)是不同细胞类型、时期和环境影响时,表观遗传动态性质和基因表达调控的一个研究热点。为了测定全基因组的组蛋白修饰,ChIP-seq技术是一种有效的方法。因此,通过比较两个ChIP-seq文库可以识别潜在的DHMSs。
结果:我们的目的是识别DHMSs,提出一种称为ChIPDiff的方法来通过ChIP-seq测定的数据全基因组比对组蛋白修饰位点。基于观察的ChIP片段数,提出了一个隐马模型的方法推断每个基因组位置的组蛋白修饰变化状态。我们通过比对小鼠ESC和NPC细胞的H3K27me3修饰位点来评估ChIPDiff的效果。我们证明了此方法确定H3K27me3 的DHMSs具有高灵敏度,特异性和重复性。进一步应用ChIPDiff揭示不同细胞时期的差异H3K4me3和H3K36me3位点。我们研究中的比对有很多有趣的生物学发现。真核DNA是被打包到一个由周围环绕组蛋白的DNA的重复核小体组成的染色质结构。组蛋白可以发生大量的翻译后修饰如,甲基化,乙酰化,磷酸化和泛素化。组蛋白修饰影响基因表达和基因组功能。大量实验证明一些组蛋白甲基化类型在生物学过程中起主要作用。一个典型的例子是在哺乳动物胚胎干细胞通过H3K27me3抑制发育调控维持干细胞多能性。在癌症中也特异的发现一些表观遗传K27干细胞标记。此外,H3K9me3、H3K9me2和癌细胞中沉默肿瘤抑制基因相关。因此,特异基因组位置的差异组蛋白修饰密度,文中称为差异组蛋白修饰位点“DHMS”,在不同细胞类型,时期和环境影响是比较研究的重点。我们可以用染色质免疫共沉淀(ChIP)来测定组蛋白修饰信号,抗体用于富集修饰位点的DNA片段。在过去的几年开发了几种基于ChIP的技术,包括ChIP-chip, ChIP-PET and ChIP-SAGE,用于大规模基因组区域的组蛋白修饰和转录因子结合位点研究。随着最近超高通量测序技术如Illumina/ Solexa GA 测序的产生,ChIP-seq成为一个主要的高覆盖、高分辨率和成本的方法。ChIP-seq的基本思想是读取ChIP富集的序列的一端,接着映射这些短读称为tag到基因组上以找到这些片段的基因组位置。一个ChIP文库中有百万个tag标签测序,形成一个代表全基因组与组蛋白修饰位点和转录因子结合位点的ChIP片段数的谱。受到ChIP-seq在单个文库识别组蛋白修饰位点的鼓舞,我们想是否可以通过计算的比较不同细胞类型和实验条件的两条ChIP-seq文库来识别DHMS。Mikkelsen等人测定了小鼠ESC、NPC和MEF细胞的H3K4me3 (K4) 和 K27位点,比较三种类型启动子区域修饰位点的发生。他们研究的局限在于修饰位点是定性的比较而非定量。一个例子说明了这种局限,K4调控K1f4,已知其和基因表达正相关。K1f4在ESC和NPC启动子定性分析中都标记K4,因此不能解释在ESC的K1f4上调。另一方面,定量比较表明ESC的K1f4启动子的K4密度比NPC多5倍,这和表达变化是一致的。据我们所知,几乎没有全基因组定量比较两个ChIP-seq文库的文献。受芯片分析的启发,一个简单的解决这个问题的方法是将基因组分为箱bins,计算每个binChIP片数的倍数变化。然而,fold-change方法对由ChIP片段随机样本的技术变化时敏感的。本文中,我们提出的方法称为ChIPDiff通过考虑连续bin之间的相关性改进了fold-change方法。我们用隐马模型建立相关性,转移概率用一种无监督方式自动训练。接下来通过训练HMM参数来推断组蛋白修饰状态的变化。为了评估ChIPDiff的性能,我们首先比较Mikkelsen数据ESC和NPC的K27文库。在全基因组识别了4277个k27的DHMS区域。三个标准显示效果是令人满意的:(a)敏感性:2006年在高度保守的非编码元件中,80%的从基因表达推断的DHMSs被ChIPDiff确定。(b)特异性:基于非细胞特异性控制比对,我们估计识别的DHMS区域的假阳性率是0.19%。(c)重复度:检查两个独立的子集的结果的交集,显示3-4百万个tags测序的57.4%的DHMSs在技术上重现,评价结果还表明,在所有三个方面的定性分析,该方法优于fold-change的方法。我们进一步应用ChIPDiff到H3K4me3(K4)和H3K36me3(K36),发现这两种类型组蛋白修饰的DHMSs和研究了他们在干细胞分化潜在的生物的作用。研究中有几个有趣的生物学发现。
2.1确定组蛋白修饰位点
给定来个ChIP-seq文库
文档评论(0)