第三章DNA序列分析.pptVIP

  • 5
  • 0
  • 约2.04万字
  • 约 189页
  • 2025-08-24 发布于广东
  • 举报

基本过程:分别抽提代测样本(tester)和对照样本(driver)的mRNA,反转录成cDNA,用RsaI或HaeIII酶切,以产生大小适当的平头末端cDNA片段,将testercDNA分成均等的两份,各自接上两种接头,与过量的drivercDNA变性后退火杂交,第一次杂交后有4种产物:a是单链testercDNA,b是自身退火的testercDNA双链,c是tester和diver的异源双链,d是drivercDNA。第一次杂交的目的是实现tester单链cDNA均一化(normalization),即使原来有丰度差别的单链cDNA的相对含量达到基本一致,由于testercDNA中与drivercDNA序列相似的片段大都和driver形成异源双链分子c,使testercDNA中的差异表达基因的目标cDNA得到大量富集,第一次杂交后,合并两份杂交产物,再加上新的变性driver单链,再次退火杂交,此时,只有第一次杂交后经均等化和扣除的单链testercDNA和drivercDNA一起形成各种双链分子,这次杂交进一步富集了差异表达基因的cDNA,产生了一种新的双链分子e,它的两个5’端有两个不同的接头,正由于这两上不同的接头,使其在以后的PCR中被有效地扩增。第126页,共189页,星期日,2025年,2月5日抑制性差减杂交技术(SSH)原理图(Diatchenko等,1996)第127页,共189页,星期日,2025年,2月5日二、序列测定及数据分析随机挑取克隆进行5’或3’端测序序列前处理聚类和拼接基因注释及功能分类后续分析第128页,共189页,星期日,2025年,2月5日测序方向的选择根据不同的实验目的选择不同的测序方向:◆5’端5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用5’端EST较好,大部分EST计划都是选用5’端进行测序的,而且从5’端测序有利于将EST拼接成较长的基因序列。第129页,共189页,星期日,2025年,2月5日◆3’端3’端mRNA有一20-200bp的plyA结构,同时靠近plyA又有特异性的非编码区,所以从3’端测得EST含有编码的信息较少.但研究也表明,10%的mRNA3’端有重复序列,这可以作为SSR标记;非编码区有品种的特异性,可以作为STS标记.◆两端测序获得更全面的信息。第130页,共189页,星期日,2025年,2月5日1.去除低质量的序列(Phred)2.应用BLAST、RepeatMasker或Crossmatch遮蔽数据组中不属于表达的基因的赝象序列(artifactualsequences)。●载体序列(/repository/vector)●重复序列(RepBase,)●污染序列(如核糖体RNA、细菌或其它物种的基因组DNA等)3.去除其中的镶嵌克隆。4.最后去除长度小于100bp的序列。序列前处理(pre-processing)第131页,共189页,星期日,2025年,2月5日镶嵌克隆的识别?Back-to-backpoly(A)+tails.?Linker-to-linkerinmiddleofthesequence.?Blastn/Blastxsearch.第132页,共189页,星期日,2025年,2月5日第133页,共189页,星期日,2025年,2月5日CpG岛(CpGisland)?CpG岛是指DNA上一个区域,此区域含有大量相联的胞嘧啶(C)、鸟嘌呤(G),以及使两者相连的磷酸酯键(p)。哺乳类基因中的启动子上,含有约40%的CpG岛(人类约70%)。一般CpG岛的长度约300到3000个bp。通常的含义是指一个至少含有200bp的区域,其中GC所占比例超过50%,且CpG的观察值/预测值比例必须高于0.6。此霸部份的CpG岛与基因相连,可用来作为限制酶的辨识位置。????第94页,共189页,星期日,2025年,2月5日哺乳动物基因组DNA中CpG岛的特点是胞嘧啶(C)与鸟嘌呤(G)的总和超过4种碱基总和的50%,即每10个核苷酸约出现一次双核苷酸序列CG。具有这种特点的序列仅占基因组DNA总量的10%左右。从已知的DNA序列统计发现,几乎所有的管家基因(House-Keepinggene)及约占40%的组织特异性基因的5’末端含有CpG岛,其序列可能包括基因转录的启动子及第一个外显子。因此,在大规模DNA测序计划中,每发现一个CpG岛,则预示可能在此存在基因。另外,AT含量也可以作为编码区的批示指标之一。第95页,共189页,星期日,2

文档评论(0)

1亿VIP精品文档

相关文档