- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
顺反组数据库和数据分析平台的构建
2011级⽣物医学⼯程专业硕⼠孙翰菲毕业答辩
2014年5⽉20 ⽇
引⾔:转录因⼦与顺反组
✤ 转录⽔平的调控在真核⽣物基因表达中起重要作⽤。
✤ 转录⽔平的调控通常受到转录因⼦的影响,⼤部分转录因⼦都是⼀类特异识别某些DNA
序列与之结合的蛋⽩质。
✤ 在直接调控的情形下,转录因⼦直接在基因的调控区域上结合。⽽在间接调控中,转录因
⼦不与基因的调控区域直接结合,⽽是⽤来调控另⼀个能结合在该区域的蛋⽩质的表达量。
✤ 转录因⼦,组蛋⽩修饰,染⾊
质调控因⼦的结合位点统称为
顺反组(Cistrome )
!
引⾔:ChIP-seq技术
✤ ChIP-seq技术是⼀种检测蛋⽩质与DNA
结合位置的技术。它的基本步骤是:
1)将蛋⽩质与DNA交联在⼀起,将交联
的复合物切断为0.2-1.0kb的染⾊质⼩⽚断
2 )利⽤特异的抗体,沉淀交联的复合物
3 )将复合体中的DNA分离出来,进⾏纯
化
4 )⾼通量测序
5 )将测序读段回帖,找到富集区域
!
引⾔:ChIP-seq技术的难点
✤ 测序后的⽣物信息学分析
✤ 公共数据的检索
✤ 数据重⽤
选题背景
✤ 测序费⽤降低,ChIP-seq和DNase-seq数据数量快速增长。
✤ ⾃从2012年,每年发布的ChIP-seq ,DNase-seq数据都超过5000套,这些已发布的海量数据具有巨⼤的研
究价值,然⽽由于元信息不规范,缺乏整理,给检索和使⽤造成了困难。
✤ 对于实验⽣物学家,检索和利⽤已有的ChIP-seq和DNase-seq数据门槛较
⾼。
✤ 数据处理需要多种⼯具,这些⼯具的安装和配置⽐较繁琐。若使⽤已处理的数据,⼀旦数据处理流程不
同,就没有可⽐性。测序数据体积庞⼤,下载、处理、分析、存储这些数据都费时费⼒。
✤ ⽬前缺乏将海量ChIP-seq ,DNase-seq数据与分析⼯具整合的⼿段。
✤ 数据分析平台只能从数据仓库中导⼊原始测序⽂件,研究者想使⽤⼀套公共数据,必须从头分析,⽽不能
使⽤已有的分析结果,数据重⽤性较差。
论⽂研究⽬标
✤ 收集所有公共域上的ChIP-seq与DNase-seq数据,将元
信息规范化,便于信息检索。
✤ 对数据进⾏统⼀的处理,分析与质量控制,提⾼了数据
重⽤性,使得海量数据的信息挖掘成为可能。
✤ 构建数据分析⽹站,使得研究者可以直接在⽹站上对海
量数据进⾏分析与检索。
论⽂研究内容
收集数据 处理数据 构建⽹站
元信息收集系统 流程管理 数据浏览器
样本分组系统 数据处理 转录位点浏览器
数据库系统 质量控制 相似数据检索
数据分析平台
数据收集:挑战
✤ 2011年以前,⼈⼯收集了5066套
✤ 2012年,发布了5241套数据
✤ ⼈⼯收集难以维持,改⽤⾃动化
的⽅式
!
GEO数据库每年发布的ChIP-seq和DNase-seq样本数
数据收集:实现
✤ ⽹络模块:⽤于下载元信息
✤ 元信息提取模块:⽤于将隐藏在
描述信息⾥的关键词,⽐如转录
因⼦、细胞的名称,提取出来,
采⽤基于规则的⽅法。
您可能关注的文档
最近下载
- 2023年中国人民大学信息管理与信息系统专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
- 2025年一级建造师公路桥梁上部结构装配与架设专题模拟试卷及解析.pdf VIP
- 面向领域适配任务的样本重要性重加权迁移学习算法体系分析.pdf VIP
- 2025年通信工程师DCCP协议拥塞控制机制专题试卷及解析-判断题.pdf VIP
- 多源异构医学数据库融合下的知识图谱构建数据标准与接口协议研究.pdf VIP
- 分层式联邦学习框架在复杂图像分割任务中的结构优化与协议演化.pdf VIP
- 联邦分布式图学习在黑产风险识别系统中的模型构建方案.pdf VIP
- 面向短视频平台的多模态内容分析与语义理解算法深度研究.pdf VIP
- 战略协议合作框架协议(通用10).pptx VIP
- 2025年招标师投标保证金与履约保证金管理的廉政风险点专题试卷及解析.pdf VIP
原创力文档


文档评论(0)