- 185
- 0
- 约3.15万字
- 约 13页
- 2018-03-07 发布于天津
- 举报
基因芯片的数据处理与分析-清华大学
第 2 卷 第 3 期 2006 年 5 月
基因芯片的数据处理与分析
张学工 凡时财 裴云飞
关键词:基因芯片 数据处理 清华大学
因的DNA探针,从而同时测定这些基因在样品
引言 中的表达。这一类技术通常被称作DNA微阵列
(microarray),中文更多地称为基因芯片,
本 世 纪 初 , 人 类 基 因 组 计 划 ( H u m a n 而英文的GeneChip由于已经被公司注册为专有
Genome Project)的完成标志着生命科学的研究 的名称,因此只用来指特定的芯片类型。基
进入后基因组时代。如何理解这些海量的遗传 3
因芯片是生物芯片 (BioChips)大家族中的一
信息成为后基因组时代的重要任务。分子生物 员,也是最重要的一员,其他类型的生物芯片
学的中心法则告诉我们,细胞中的基因最主要 还包括蛋白质芯片、组织芯片等等。与传统的
是通过从DNA转录到RNA(mRNA)、再翻译 分子生物学和生物化学实验只能一次得到很
成蛋白质来发挥作用的。根据目前的认识,人 有限的数据相对照,这些能够同时获取大量
类基因组中编码蛋白质产物的基因的总数大约 生物分子数据的技术被统称为高通量(high-
在20000~25000之间或者更多。这些基因在人 throughput)技术。
体内不同组织的细胞中、在细胞不同的发育阶 以基因芯片为代表的高通量分子生物学技
段有着不同的表达量,即所转录出的mRNA的 术的产生,使得科学家获取实验数据的能力大
丰度。而且基因的表达是受到调控的,众多基
因在时间和空间上有规律地协调表达,是细胞
和生物体正常生命活动的基础。
研究基因的表达无疑会对认识很多生命
现象的规律具有重要意义。传统的用于研究
基因表达的实验方法(如Northern-Blotting技
术 1 ),仅适用于单个或者较少几个基因。20
世纪末,随着生物化学技术的发展,并受到
计算机领域高密度芯片生产技术的影响,诞
生了能够同时测量成千上万个基因的mRNA2
表达量的新技术。通过这些技术,能够在一个
几平方厘米的芯片上放置对应于成千上万个基
1 一种核酸印迹杂交技术
2 信使核糖核酸
3 由于常用玻片/硅片作为固相支持物,且在制备过程模拟计算机芯片的制备技术,所以称之为生物芯
片技术。
3
封面报道 第 2 卷 第 3 期 2006年 5 月
大增强,在一张芯片上就能获得从上万个到上 microarray,简称cDNA芯片)和寡核苷酸芯片
百万个探针的观测值,其中包含了数千个到数 (oligonucleotide microarray)两大类。cDNA芯
万个基因的表达值。这种海量的数据一方面为 片是将实验室制备的探针通过点样固定在基片
发现更多、更复杂的生物规律
原创力文档

文档评论(0)