生物信息硕士答辩--顺反组数据库.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
顺反组数据库和数据分析平台的构建 2011级⽣物医学⼯程专业硕⼠孙翰菲毕业答辩 2014年5⽉20 ⽇ 引⾔:转录因⼦与顺反组 ✤ 转录⽔平的调控在真核⽣物基因表达中起重要作⽤。 ✤ 转录⽔平的调控通常受到转录因⼦的影响,⼤部分转录因⼦都是⼀类特异识别某些DNA 序列与之结合的蛋⽩质。 ✤ 在直接调控的情形下,转录因⼦直接在基因的调控区域上结合。⽽在间接调控中,转录因 ⼦不与基因的调控区域直接结合,⽽是⽤来调控另⼀个能结合在该区域的蛋⽩质的表达量。 ✤ 转录因⼦,组蛋⽩修饰,染⾊ 质调控因⼦的结合位点统称为 顺反组(Cistrome ) ! 引⾔:ChIP-seq技术 ✤ ChIP-seq技术是⼀种检测蛋⽩质与DNA 结合位置的技术。它的基本步骤是:
 1)将蛋⽩质与DNA交联在⼀起,将交联 的复合物切断为0.2-1.0kb的染⾊质⼩⽚断
 2 )利⽤特异的抗体,沉淀交联的复合物
 3 )将复合体中的DNA分离出来,进⾏纯 化
 4 )⾼通量测序
 5 )将测序读段回帖,找到富集区域 ! 引⾔:ChIP-seq技术的难点 ✤ 测序后的⽣物信息学分析 ✤ 公共数据的检索 ✤ 数据重⽤ 选题背景 ✤ 测序费⽤降低,ChIP-seq和DNase-seq数据数量快速增长。 ✤ ⾃从2012年,每年发布的ChIP-seq ,DNase-seq数据都超过5000套,这些已发布的海量数据具有巨⼤的研 究价值,然⽽由于元信息不规范,缺乏整理,给检索和使⽤造成了困难。 ✤ 对于实验⽣物学家,检索和利⽤已有的ChIP-seq和DNase-seq数据门槛较 ⾼。 ✤ 数据处理需要多种⼯具,这些⼯具的安装和配置⽐较繁琐。若使⽤已处理的数据,⼀旦数据处理流程不 同,就没有可⽐性。测序数据体积庞⼤,下载、处理、分析、存储这些数据都费时费⼒。 ✤ ⽬前缺乏将海量ChIP-seq ,DNase-seq数据与分析⼯具整合的⼿段。 ✤ 数据分析平台只能从数据仓库中导⼊原始测序⽂件,研究者想使⽤⼀套公共数据,必须从头分析,⽽不能 使⽤已有的分析结果,数据重⽤性较差。 论⽂研究⽬标 ✤ 收集所有公共域上的ChIP-seq与DNase-seq数据,将元 信息规范化,便于信息检索。 ✤ 对数据进⾏统⼀的处理,分析与质量控制,提⾼了数据 重⽤性,使得海量数据的信息挖掘成为可能。 ✤ 构建数据分析⽹站,使得研究者可以直接在⽹站上对海 量数据进⾏分析与检索。 论⽂研究内容 收集数据 处理数据 构建⽹站 元信息收集系统 流程管理 数据浏览器 样本分组系统 数据处理 转录位点浏览器 数据库系统 质量控制 相似数据检索 数据分析平台 数据收集:挑战 ✤ 2011年以前,⼈⼯收集了5066套 ✤ 2012年,发布了5241套数据 ✤ ⼈⼯收集难以维持,改⽤⾃动化 的⽅式 ! GEO数据库每年发布的ChIP-seq和DNase-seq样本数 数据收集:实现 ✤ ⽹络模块:⽤于下载元信息 ✤ 元信息提取模块:⽤于将隐藏在 描述信息⾥的关键词,⽐如转录 因⼦、细胞的名称,提取出来, 采⽤基于规则的⽅法。

文档评论(0)

chqs52 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档