4-转录组学研究方法.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
4-转录组学研究方法

图像扫描 Cy5 Cy3 归一化 差异基因筛选 原理:采用cy3/cy5的ratio值对差异基因进行 判断,或采用统计方法对差异基因进行统计推断。 方法:倍数法:cy3/cy5比值大于2或者小于 0.5 Z值法: Z=(X-μ)/σ 作用:发现两个样本间的差异表达基因,便于后续分析。 基因表达聚类分析 转录组学方法尤其是DNA微阵列的应用导致基因表达数据爆炸性增长。如何对这些数据进行分析,从中提取有意义的生物学信息,已成为转录组学的研究热点和技术瓶颈。 聚类分析技术能将待处理的对象分配到相应的聚类中,使得同一聚类中的对象差别较小,不同聚类之间的对象差别较大。 聚类分析技术在转录组学研究中,非常适合大批量分析基因群的功能。 基因表达聚类的数据表现 Systematic variation in gene expression patterns in human cancer cell lines. Nature, 2000, Ross et al. 聚类的类型 Hierarchical Clustering Link similar genes, build up to a tree of all K-means Self Organizing Maps (SOM) Principle Component ( PCA ) 因为EST序列是从某特定组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化和差减杂交的cDNA文库EST分析特定组织的基因表达谱。标准化的cDNA文库和经过差减杂交的cDNA文库则不能反应基因表达的水平。 ◆ CGAP 为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析计划(Cancer Genome Anatomy Project , CGAP)构建了很多正常的或是癌症前期的和癌症后期的组织的cDNA文库,并进行了大规模的EST测序,其中大部分的文库未经标准化或差减杂交处理。 CGAP网站提供了多种工具用以分析不同文库间基因表达的差异, 如: ● Digital Gene Expression Displayer (DGED) ● cDNA xProfiler EST的应用 4:利用EST大规模分析基因表达水平 EST技术流程:一、cDNA文库构建 ◆ 非标准化的cDNA文库的构建。(可用于基因表达量的分析) ◆ 经标准化或扣除杂交处理的cDNA文库。(富集表达丰度较低的基因) ◆ Oligo d(T) cDNA文库。 (非翻译区由于不含有编码序列,与编码区保守序列相比所受到的选择压力比较小,因而其多态性程度比较高,便于多态性位点的选择以用于遗传图谱的构建。 ) ◆ 随机引物cDNA文库。 (所获得的EST在基因功能的鉴定时具有更多的信息含量,并且在构建EST数据库时更有优势,同时有利于利用EST数据库聚类完整的基因和阅读框的寻找,便于利用更敏感的蛋白质比较来寻找同源基因。 ) 二、序列测定及数据分析 随机挑取克隆进行5’或3’端测序 序列前处理 聚类和拼接 基因注释及功能分类 后续分析 EST软件平台 EST序列 库/序列的质量检查 测序量监控 聚类和拼接检查 (借助于基因组信息) 全长ORF寻找 发现全长基因 研究表达基因概况的主要实验手段(DNA chip、proteomics的先驱) 功能分类 表达量分析 SAGE的先驱 交替剪接检测 EST特有信息 测序方向的选择 根据不同的实验目的选择不同的测序方向: ◆ 5’端 5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用5’端EST较好,大部分EST计划都是选用5’端进行测序的,而且从5’端测序有利于将EST拼接成较长的基因序列。 ◆ 3’端 3’端mRNA有一20-200bp的plyA结构,同时靠近plyA又有特异性的非编码区,所以从3’端测得EST含有编码的信息较少.但研究也表明,10%的mRNA3’端有重复序列,这可以作为SSR标记;非编码区有品种的特异性,可以作为STS标记. ◆ 两端测序 获得更全面的信息。 基因注释及功能分类 注释: ◆ 序列联配 Blastn, Blastx ◆ 蛋白质功能域搜索(二结构比对) Pfam Interproscan 较好匹配 InterproScan Nt Blastn EST sequences Nr Blastx 完成注释 无理想匹配 较好匹配 完成注释 无理想匹配 较好匹配 无理想匹配 New sequences 域的注释 后 续 分 析 常用的基因注释流程 ◆ 手工分类 大部分以Adams 95年的文章中的采用分类体系为标

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档