基因体分析计划.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因体分析计划.ppt

* schedule89 BIOINFORMATICS A Biological + Computational Science Computational Management Genes Proteins Biological Information of all kinds of Databases Analytical Software BIOINFORMATICS 生物資訊 Analysis Biological Databases Information Retrieval Internet 網際網路上各種生命科學 相關資料之取得及應用 Genome Projects and BIOINFORMATICS June 2000, the first draft of Human Genomic sequence Stanford Sanger WashU TIGR U Wisc YPD AGIS CBCUMN OU-ACGT Utah FlyBase FruitFly RGP MaizeDB MIT JAX Genethon CHLC NRSub NITE KDRI Heidelberg ChGP Gnomics ASTRA Diversa Microbial genomes Archaea Bacteria Eukaryota Viruses Viroids Plasmids The Genome Projects 基因體分析計劃 mRNA Gene Protein Gene Products Gene Expression (The Central Dogma) Muscle cell Skin cell Nerve cell Gene A Gene B Gene C The DNA Content of Various Cells Pokaryotic Escherichia coli 4 x 106 Eukaryotic Saccharomyces cerevisiae 1.35 x 107 Drosophila melanogaster 1.65 x 108 Homo sapiens 2.9 x 109 Zea mays 5.0 x 109 Organism Number of Base pairs Human Genome: 3 x109 bps Human Gene (5% of the genome): 100,000 genes Gene Products (2% of the gene): 20,000 gene products 有人估計在染色體上,只有 2~3% 左右是真正具有基因的序列,其它的序列可能大多數的序列都是「junk」DNA。因此,人類基因體計劃在提出之後,生物學家對於要定序的策略產生了兩派意見 有人認為決定所有的染色體序列只會獲得一大堆沒用的資料,若以決定 mRNA 序列為目標,則可以直接找到有功能的序列。 另外一派則認為,若直接對染色體定序,可以將許多重複性的步驟自動化,是較有效率的方法,此外,也可以避免誤失掉表現量較少的 mRNA。 在考慮各種優缺點之後,最後人類基因體計劃是以染色體全序列定序為主要目標 (3x109bps, 100,000 genes)。 基因體分析計劃 (The Genome Projects) 將由細胞之中抽出的 mRNA,以隨機引子或是含有 oligo(dT) 的引子進行 RT-PCR,再用適當的限制酵素切割,進行選殖。對已得到的各個菌株加以整理,以有系統的方式,對每一個菌株的插入片段,進行單一次自動化定序 (single-pass automatic sequencing),所得到序列即被稱為表現序列標幟。因為只進行單向與單一次的定序,並未經過再一次的確認,而且一些無法由機器自動判斷的區域,可能也未以人工的方式予以校正,因此這種序列的特徵之一,就是含有不少的錯誤,比如說可能會含有不少鹼基的插入、刪除、以及不明確性,而且這種現象在愈接序列資料的 3’端愈明顯,因此在做序列比對時必須慎選程式使用。 表現序列標幟 (Expressed sequence tag, EST) 圖1 EST序列的產生 以 3’未轉譯區域成為基因序列標幟位置 (Wilcox, et al, 1991)。 由於各個不同基因的 3’未轉譯區域大多是獨特的,因此用來作為特定基因的標幟是很恰當的選擇,更好的是可以避免 intron 的干擾。但是若以這種方式來進行,就必須要有許多已知基因的序列才行。 以 5’未轉譯區域成為基因序列標幟位置(Adams, et al, 1991)。 利用5‘表現序列標幟來輔助基因定位的概念 表現序列

您可能关注的文档

文档评论(0)

shiyouguizi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档