生物信息学(第二版).pdfVIP

  • 1079
  • 0
  • 约6.46千字
  • 约 6页
  • 2022-07-25 发布于上海
  • 举报
《精要速览系列-先锋版 生物信息学(第二版)》 D.R.Westhead,J.H.Parish R.M.Twyman 科学出版社 2004 A生物信息学概述 相关学习网站 www.bios.co.uk/inbioinformatics B数据采集 DNA,RNA和蛋白质测序 1.DNA测序原理 DNA 中核苷酸的顺序是通过链式终止测序【也称为脱氧测序 (dideoxy sequencing) 或以发明人命名的Sanger 方法】来确定。 2.DNA序列的类型 基因组DNA,是直接从基因组中得到,包括自然状态的基因 复制DNA (copy DNA, cDNA),通过反转录mRNA得到的 重组DNA ,包括载体序列如质粒,修饰过的病毒和在实验室使用的其他遗传元件 等 3.基因组测序策略 散弹法测序 (shotgun sequence)包括随机DNA 片段的生成,通过大量片段测序来 覆盖整个基因组 克隆重叠群测序 (clone contig)DNA 片段用推理的方法亚克隆,并且进行系统的 测序直到整个序列完成 4.序列质量控制 通过在DNA 双链上进行多次读取完成高质量序列数据的测定 可使用如Phred 等程序对最初的跟踪数据 (trace data )进行碱基识别和质量判断。 载体序列和重复的DNA 片段被屏蔽后,使用Phred 等程序将序列拼接成重叠群 (contigs ),剩下的不一致部分通过人工修饰解决 5.单遍测序 低质量的序列数据可以由单次读段(read )产生(单遍测序,single-pass sequencing)。 尽管不很准确,但单遍测序如ESTs 和GSSs,可以低廉的价格快速大量的产生 6.RNA测序 因为有大量的小核苷酸 (minor nucleotide )(化学改变的核苷)存在于转移RNA (tRNA )和核糖体RNA (rRNA )中,所以RNA 测序不能像DNA 测序那样直接进行。 需要用特殊的方法来识别被改变的核苷,包括生化实验,核磁共振谱(NRM spectroscopy)和质谱(MS )技术 7.蛋白质测序 蛋白质序列可以通过DNA 序列推断得到,而RNA 测序不能提供有关已改变残基 或其他类型的翻译后蛋白质修饰(比如剪接或二硫键的形成) 大部分蛋白质测序是通过质谱(MS )技术进行的 基因和蛋白质表达数据 1.全局表达分析 RNA 水平的分析中有效的方法是从RNA 群体或cDNA 文库中,甚至从序列数据 库中进行序列采样。一个简单的方法是从cDNA 文库中随机挑选5000 个克隆进行测序。 含量很多的mRNAs 在采样的序列中出现的频率很高,而含量较少的mRNA 出现频率 则较低,通过这些数据的统计分析可以确定相对的表达水平。 一个更高级的技术是 基因表达的连续分析 (seria analysis of gene expreaaion, SAGE )该方法使每个cDNA 产生很短的序列标签(通常8~15nt),并在测序前把数百 个标签连接成连环分子(concatemer )。这样一个测序反应中可搜集到几百条mRNA 的丰富信息。每个 SAGE 标签可以特异性识别一个特定基因,通过对标签计数,可以 确定每个基因的相对表达水平。 然而,大部分全局RNA 表达数据还需从微阵列实验所测的信号强度中获取。全局 蛋白质表达数据主要从双向聚丙烯酰胺凝胶电泳 (two-dimensiona polyacrylamide ge electrophoresis, 2D)分离,产生点阵的唯一模式(每个点代表一个单独的蛋白质)。 在2D实验中,蛋白质表达数据可以通过每个点的信号强度得到,每个二维凝胶 上的蛋白信号必须通过质谱(MS )技术来单个注释。 2.DNA微阵列 一个微阵列有一系列的 DNA 元件(

文档评论(0)

1亿VIP精品文档

相关文档