Hi-C三维基因组学研究利器(一).PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Hi-C三维基因组学研究利器(一).PDF

Hi-C :三维基因组学研究利器 (一) Hi-C 发展历史 DNA 在染色体上是高度折叠的,DNA 与 DNA 片段之间不可避免的形成了高强度的交互作用, 对基因的表达、远端调控等起重要作用。2002 年 Dekker 等[1]提出利用 3C 技术研究染色体的 三维构象,该技术基于 PCR 原理,针对特定位点设计上下游引物,用于研究单个点和点之间的 相互作用;在此基础上发展起来的 4C 技术[2] ,将DNA 片段连接成环,然后设计引物进行反向 PCR ,可以研究一个点和多个点之间的相互作用;5C 技术[3]进一步发展,在 DNA 片段两端加 上通用引物,进而实现多个点和多个点之间的相互作用;3C、4C 和 5C 技术都是基于 PCR 技 术发展而来,不能用于研究全基因组范围内所有点之间的相互作用。2009 年 Lieberman-Aiden[4]等提出的 Hi-C 技术,在片段两端加上生物素标记,再利用磁珠对其捕获, 进而实现全基因组范围内所有点之间的相互作用的研究,Hi-C 技术的出现,将三维基因组学的 研究向前推进一大步。 图 1 Hi-C 发展历史[5] Hi-C 实验流程 2009 年发表在 science[4]的 Hi-C 技术称为第一代 Dilution Hi-C ,该文章对Hi-C 实验流程进 行了详细叙述,主要步骤包括甲醛交联、细胞裂解、内切酶酶切、末端修复及生物素标记、片 段连接、捕获带生物素标记的片段、双端测序等。2011 年 Chen Lin 等[6]意识到细胞核的扰动 会影响染色质的高级构象,故而将反应体系固定在磁珠上,减小反应体系的扰动,大大提高了 信噪比。2014 年发表在 Cell[7]上的文章进一步对 Hi-C 实验流程进行改进,将 DNA-DNA 的连 接反应在完整的细胞核中进行,而并非在早期裂解细胞,将该方法定义 In situ Hi-C ,有效数据 较 Dilution Hi-C 获得较大提升。文库构建是 Hi-C 技术的重难点,文库质量将直接影响后续的 有效 Hi-C 数据,因此进一步加强对实验流程的优化仍将是后续 Hi-C 研究的重点。 图 2 Hi-C 实验流程[7] Hi-C 数据处理 Hi-C 文库测序基于二代测序平台,首先,对 Raw Data进行过滤,去除接头序列及低质量 Reads , [8] [9] 获得高质量的 Clean Data ;其次利用BWA 或者 HiC-Pro (调用bowtie2 )将双端Clean Data 与组装好的基因组序列进行比对,获得唯一比对到基因组上的 Reads ;然后使用HiC-Pro 或者 HiCUP[10]软件分析比对结果,识别 Valid Interaction Pairs 和 Invalid Interaction Pairs ,其 中,Invalid Interaction Pairs 主要主要包含自连类型(Self-circle Ligation ),末端悬挂类型 (Dangling Ends )、相邻连接类型(Re-ligation )和其他丢弃的类型(Dumped ),Valid Interaction Pairs 数据在 30%以上即认为数据合格,可用于后续研究。 图 3 Hi-C 数据处理[9] Hi-C 研究内容 细胞核内的染色体都是高度折叠的,不同物种的折叠方式各不相同,包括 Rabl、Bouquet 和 Rosette 结构。染色体长度较长的物种倾向于采用 Rabl 结构(如大麦[11] ),该结构每条染色体 向后折叠使长臂和短臂并列,着丝粒和端粒分别聚集在细胞核两级,而染色体长度较短的物种 则倾向于采用 Rosette 结构(如拟南芥[12] ),该结构中心是高度折叠的着丝粒区域及大的重复 序列,周围是常染色质环结构。我们通过 Hi-C 对高度折叠的染色体进行研究,用于辅助基因组 组装、解析染色质空间构象和构建染色体单倍型图谱等。 图 4 细胞内染色体折叠方式[13] 辅助基因组组装 细胞核内每条染色体都占据着一个独特区域,称为染色体疆域,同一染色体上的交互频率高于 不同染色体间的交互频率,从而实现将初步组装的 Contigs 分配到

文档评论(0)

zcbsj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档