网站大量收购独家精品文档,联系QQ:2885784924

医学生物信息学绪论-1PPT.ppt

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学生物信息学绪论-1PPT

染色体=DNA+相关蛋白质 DNA的双螺旋结构 DNA的分子组成 核甘(nucleotides) 磷酸盐(phosphate) 糖(sugar) 四种碱基: 腺嘌呤(Adenine) 鸟嘌呤(Guanine) 胞嘧啶(Cytosine) 胸腺嘧啶(Thymine) DNA的双螺旋结构的碱基互补:A/T C/G DNA复制或克隆原理 基因组的定义 任何一条染色体上都带有许多基因,一条高等生物的染色体上可能带有成千上万个基因,一个细胞中的全部基因序列及其间隔序列统称为基因组( genomes )。 基因的定义 DNA上具有特定功能、负责一种特性表达的一个片断叫基因。一般来讲,一个基因只编码一个蛋白质。 DNA、 RNA与蛋白质 DNA:两条互补链。由ATCG四个碱基字母形成的字符串描述。 RNA:单链结构。由AUCG四个碱基字母形成的字符串描述。 蛋白质:一条或多条肽链。每个肽链是由20种氨基酸形成的长链,即20个氨基酸字母形成的字符串描述。 翻译:每3个碱基翻译成一个氨基酸。 DNA上的基因 PCR的作用 DNA体外扩增方法的一种,能够将很少的样本,比如一滴血,就能扩增为完全相同的无数个拷贝。 类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。 每PCR一个循环,扩增两倍 1-2-4-8-16… PCR的原理 复制过程类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火--延伸三个基本反应步骤构成: ① 模板DNA的变性:模板DNA经加热至93℃左右一定时间,使DNA双链解为单链,以便它与引物结合,为下轮反应作准备 ② 模板DNA与引物的退火(复性):模板DNA经加热变性成单链后,温度降至55℃左右,引物与模板DNA单链的互补序列配对结合 ③引物的延伸:DNA模板--引物结合物在TaqDNA聚合酶的作用下,以dNTP为反应原料,靶序列为模板,按碱基配对与半保留复制原理,合成一条新的与模板DNA 链互补的半保留复制链。重复循环变性--退火--延伸三过程,就可获得更多的“半保留复制链”,而且这种新链又可成为下次循环的模板。每完成一个循环需2~4分钟, 2~3小时就能将待扩基因扩增放大几百万倍。到达平台期(Plateau)所需循环次数取决于样品中模板的拷贝。 PCR 原理示意图 电泳测序原理 在凝胶一端小槽中放入荧光标记的DNA片断,两端加电压,短DNA片断跑得快,长DNA片断跑得慢。 测序时需要区分长度只差一个碱基的片断 负极 正极 DNA样本 电泳带 电泳槽 测序流程 确定一条染色体片断上的碱基顺序叫测序。 Sanger法: 在PCR时加入荧光标记的复制终止剂,比如ddA,ddT,ddC,ddG(相应于4种碱基) ddX的两个作用: 可以当作正常碱基参与复制 一旦链入DNA中,其后就不能再继续连接 电泳 谁终止,碱基就是谁 此方法获1974年的Nobel奖 Sanger的步骤: 第一步:加入复制终止剂 荧光检测探头 电泳,看谁跑得快 第二步:荧光检测 Shotgun测序 DNA的提取和纯化 载体预备:与DNA片断结合,从而能够在细菌中扩增。 DNA片段的制备:将DNA用超声波切成能够测序的小片断 转化培养:小片断和载体结合,植入细菌中进行扩增。 提质粒:从细菌中提取出繁殖好的质粒 电泳检测:检测质量的好坏 测序:上测序仪测序 DNA整体 小段和载体结合 结合后进行测序 切成小段 测序前的准备过程:  细菌扩增 Shotgun测序 拼接 因为整个基因组太长(上M),而每次只能测得一个500的小片断(read) 拼接的问题是如何根据不同的片段序恢复原始顺序? 类比:10本圣经,都从随机点起始剪成500个字母左右的小纸条,问:给你这么一堆小纸条,你能读出圣经来吗? 拼接错误难免! Shotgun法序列拼接 Consensus Sequence Gap Low Base Quality Single Stranded Region Mis-Assembly (Inverted) 拼接中的重复错误 测序后的工作 测序之前几乎全是分子生物学工作。 测序的结果:得到了一组天然形式化的代表碱基的字符串:ATCG串 测序之后就全是计算机信息学的问题。 信息学的核心问题: 字符串对比:两个字符串的差距 字符串拼接问题 蛋白质一维预测二、三维结构预测 在生物学的研究中,将未知序列同已知序列进行比较分析已经成为一种强有力的研究手段 ,生物学领域中绝大部分的问题在计算机科学领域中主要体现为序列或字符串的计算和比较问题 。 小结 描述了生物信息学产生背景,定义了生物信息学概念。 阐述了生物信息学的广义与现代研究的范畴,以及生物信

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档