《课件3-转录组学》.pptVIP

  • 85
  • 0
  • 约7.06千字
  • 约 64页
  • 2018-09-24 发布于四川
  • 举报
基因表达聚类分析 转录组学方法尤其是DNA微阵列的应用导致基因表达数据爆炸性增长。如何对这些数据进行分析,从中提取有意义的生物学信息,已成为转录组学的研究热点和技术瓶颈。 聚类分析技术能将待处理的对象分配到相应的聚类中,使得同一聚类中的对象差别较小,不同聚类之间的对象差别较大。 聚类分析技术在转录组学研究中,非常适合大批量分析基因群的功能。 基因表达聚类的数据表现 Systematic variation in gene expression patterns in human cancer cell lines. Nature, 2000, Ross et al. 谢谢! EST已经被广泛的应用于基因识别,因为EST的数目比GenBank中其它的核苷酸序列多,研究人员更容易在EST库中搜寻到新的基因(Boguski et al., 1994). ● 在同一物种中搜寻基因家族的新成员(paralogs)。 ● 在不同物种间搜寻功能相同的基因(orthologs)。 ● 已知基因的不同剪切模式的搜寻。【注:不过很难确定一个新的序列是由于交替剪切产生的或是由于cDNA文库中污染了基因组DNA序列(Wolfsberg et al., 1997)】 EST的应用 1: EST与基因识别 因为EST序列是从某特定组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化EST分析特定组织的基因表达谱。标准化的cDNA文库则不能反应基因表达的水平。 ◆ CGAP 为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析计划(Cancer Genome Anatomy Project , CGAP)构建了很多正常的或是癌症前期的和癌症后期的组织的cDNA文库,并进行了大规模的EST测序,其中大部分的文库未经标准化或差减杂交处理。 CGAP网站提供了多种工具用以分析不同文库间基因表达的差异, 如: ● Digital Gene Expression Displayer (DGED) ● cDNA xProfiler EST的应用 2:利用EST大规模分析基因表达水平 EST技术流程:一、cDNA文库构建 ◆ 非标准化的cDNA文库的构建。(可用于基因表达量的分析) ◆ 经标准化或扣除杂交处理的cDNA文库。(富集表达丰度较低的基因) ◆ Oligo d(T) cDNA文库。 (非翻译区由于不含有编码序列,与编码区保守序列相比所受到的选择压力比较小,因而其多态性程度比较高,便于多态性位点的选择以用于遗传图谱的构建。 ) ◆ 随机引物cDNA文库。 (所获得的EST在基因功能的鉴定时具有更多的信息含量,并且在构建EST数据库时更有优势,同时有利于利用EST数据库聚类完整的基因和阅读框的寻找,便于利用更敏感的蛋白质比较来寻找同源基因。 ) 二、序列测定及数据分析 随机挑取克隆进行5’或3’端测序 序列前处理 聚类和拼接 基因注释及功能分类 后续分析 EST软件平台 EST序列 库/序列的质量检查 测序量监控 聚类和拼接检查 (借助于基因组信息) 全长ORF寻找 发现全长基因 研究表达基因概况的主要实验手段(DNA chip、proteomics的先驱) 功能分类 表达量分析 SAGE的先驱 交替剪接检测 EST特有信息 测序方向的选择 根据不同的实验目的选择不同的测序方向: ◆ 5’端 5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用5’端EST较好,大部分EST计划都是选用5’端进行测序的,而且从5’端测序有利于将EST拼接成较长的基因序列。 ◆ 3’端 3’端mRNA有一20-200bp的plyA结构,同时靠近plyA又有特异性的非编码区,所以从3’端测得EST含有编码的信息较少.但研究也表明,10%的mRNA3’端有重复序列,这可以作为SSR标记;非编码区有品种的特异性,可以作为STS标记. ◆ 两端测序 获得更全面的信息。 基因注释及功能分类 注释: ◆ 序列联配 Blastn, Blastx ◆ 蛋白质功能域搜索(二结构比对) Pfam Interproscan 较好匹配 InterproScan Nt Blastn EST sequences Nr Blastx 完成注释 无理想匹配 较好匹配 完成注释 无理想匹配 较好匹配 无理想匹配 New sequences 域的注释 后 续 分 析 常用的基因注释流程 ◆ 手工分类 大部分以Adams 95年的文章中的采用分类体系为标准。 【Adams. MD, et al. Initial assess

文档评论(0)

1亿VIP精品文档

相关文档