表达序列标签EST概要.doc

下载文档

21
0
约5.75千字
约 8页
2017-01-05 发布于重庆
举报
版权申诉
保障服务

表达序列标签EST概要.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

表达序列标签EST概要

表达序列标签EST概要摘要：随着EST研究的开展、深入，以及相关研究技术和分析手段的不断改进并走向成熟，EST 数据资源不断丰富，而其本身又具备独特的优势和多方面的利用价值。本文介绍了EST序列的获取、加工、储存、分配、分析和释读的相关研究。关键词：EST 表达序列标签聚类 cDNA文库生物信息学从事对生物信息的获取、加工、储存、分配、分析和释读，并综合运用数学、计算机科学和生物学工具，以达到理解数据中的生物学含义的目的。随着人类基因组计划在世界范围内的开展，生物信息学作为一门热门交叉学科，不断地完善和发展起来作为一种强有力的工具，它在帮助我们对巨量的生物信息进行归纳和理解，从而揭示生命的奥妙的过程中发挥了重要的作用。然而信息的爆炸增长，面对复杂和庞大的数据库，如何有效地地获取我们所需要的信息，充分利用这些已有的数据资源，加速基因克隆研究已成为一个富有挑战性的课题。表达序列标签的广泛应用，为大规模进行基因克隆和表达分析提供了强大的动力，也为生物信息学功能的充分发挥提供了广阔的空问表达序列标签 (EST，Expressed Sequence Tag)是指从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列,代表了一个完整基因的一小部分。Adams等人在1991年提出了 EST技术，宣布了cDNA大规模测序时代的开始。随着大规模的测序，EST数据呈指数级增长。到了1995年中，GenBank里ESTs的数量已超过非ESTs的数量；2000年6月，将近460万的ESTs已占了GenBank里所有序列的62%。ESTs序列不止来源于人类， NCBI的dbEST（EST database）中已包含了超过250种生物来源的ESTs，包括小鼠、大鼠、秀丽线虫和黄果蝇等。除此之外，也有许多商业性的机构保存了一些属于机构内部不公开的ESTs 序列。 EST序列的制备 EST来源于一定环境下一个组织总mRNA所构建的cDNA文库，因此EST也能说明该组织中各基因的表达水平。下面是制备EST序列的过程： (1)构建cDNA文库 mRNA可以反映细胞中基因的表达情况，但RNA不能直接被克隆。从感兴趣的组织或细胞株分离、纯化mRNA，再将mRNA反转录成cDNA，并与合适的载体连接，转化受体细胞后获得cDNA文库。随着技术的成熟和构建文库所需要的试剂（盒）的商品化，构建cDNA 已经不再是十分困难的工作，甚至还可以从公司直接订购特异组织的cDNA 文库。对于EST 研究来说，根据研究目的的不同，可以将cDNA 文库分为三种类型，即未处理文库、均一化文库（normalized）和扣除文库(subtracted)。未处理文库是指在文库构建完成后未经任何处理直接用来测序的cDNA 文库，该种文库主要适应于获得全部信息的EST 研究，即不但获得文库内所表达的基因类型，而且还需要研究表达基因的丰余度和特异组织基因表达的全部信息。扣除型文库是指在构建文库时经过一轮杂交去除重复拷贝和冗余序列，所获得的cDNA 为组织特异表达类型，扣除文库对于组织特异表达基因表达谱的构建和新基因的发现是非常有帮助的。均一化文库是指在文库构建完成之后发现有过多的污染序列或某一持家基因(house keeping gene)的比例比较高，在大规模EST序列测定之前，可以用污染序列或特异持家基因（如核糖体蛋白基因）的探针进行一轮或两轮的杂交筛选，以去除污染或冗余序列。 (2)选取cDNA克隆测序现在的大规模自动测序基本上都是基于Sanger的“DNA双脱氧链末端终止测序法”进行的。具体过程是：先从文库中随机挑取大量克隆，在体外变性为单链后，利用多克隆位点接头两侧序列设计载体通用引物进行一次性自动化测序，可以测出400-600bp的序列。由于是一次性测序，所以具有较高的错误率。测序技术推进科学研究的发展, 高通量测序技术等的出现，为快速获得大量的EST序列提供了可能，且降低了研究的成本。Simpson及其同事研发了一种新的获得高通量ESTs的方法ORESTES(open reading frame expressed sequenced tags),这种方法主要是获得中心编码区的序列信息。 (3)EST制备中的错误一个典型的EST序列是短的mRNA的部分序列，一次性测序决定了ESTs具有较高的出错率，特别是两段的序列出错的概率显著高于中间部分(图2)。在EST 的前或后20%或50-100bp的碱基读取质量较低。Phred分值可用于检测序列的质量，Phred分值为20表示该碱基出现错读的概率为1/100，而Phred分值为30表示该碱基发生错读的概率为1/1000。因此