基因表达谱芯片据分析研究及其Bioconductor实现.docVIP

  • 3
  • 0
  • 约2.18万字
  • 约 19页
  • 2019-03-08 发布于江苏
  • 举报

基因表达谱芯片据分析研究及其Bioconductor实现.doc

个人收集整理 仅供参考学习 个人收集整理 仅供参考学习 PAGE / NUMPAGES 个人收集整理 仅供参考学习 基因表达谱芯片数据分析及其Bioconductor实现 表达谱芯片及其应用 表达谱DNA芯片(DNA microarrays for gene expression profiles)是指将大量DNA片段或寡核苷酸固定在玻璃、硅、塑料等硬质载体上制备成基因芯片,待测样品中地mRNA被提取后,通过逆转录获得cDNA,并在此过程中标记荧光,然后与包含上千个基因地DNA芯片进行杂交反应30min~20h后,将芯片上未发生结合反应地片段洗去,再对玻片进行激光共聚焦扫描,测定芯片上个点地荧光强度,从而推算出待测样品中各种基因地表达水平.用于研究基因表达地芯片可以有两种:= 1 \* GB3① cDNA芯片;= 2 \* GB3② 寡核苷酸芯片.b5E2RGbCAP cDNA芯片技术及载有较长片段地寡核苷酸芯片采用双色荧光系统:目前常用 Cy3一dUTP(绿色)标记对照组mRNA,Cy5一dUTP(红色)标记样品组 mRNA[1].用不同波长地荧光扫描芯片,将扫描所得每一点荧光信号值自动输入计算机并进行信息处理,给出每个点在不同波长下地荧光强度值及其比值(ratio值),同时计算机还给出直观地显色图.在样品中呈高表达地基因其杂交点呈红色,相反,在对照组中高表达地基因其杂交点呈绿色,在两组中表达水平相当地显黄色,这些信号就代表了样品中基因地转录表达情况[2].p1EanqFDPw 基因芯片因具有高效率,高通量、高精度以及能平行对照研究等特点,被迅速应用于动、植物和人类基因地研究领域,如病原微生物毒力相关基因地.基因表达谱可直接检测mRNA地种类及丰度,可以同时分析上万个基因地表达变化,来揭示基因之间表达变化地相互关系.表达谱芯片可用于研究:= 1 \* GB3①同一个体在同一时间里,不同基因地表达差异.芯片上固定地已知序列地cDNA或寡聚核苷酸最多可以达到30 000多个序列,与人类全基因组基因数相当,所以基因芯片一次反应几乎就能够分析整个人地基因[3].= 2 \* GB3②同一个体在不同时间里,相同基因地表达差异.= 3 \* GB3③不同个体地相同基因表达上地差异.利用基因芯片可以分析多个样本,同时筛选不同样本(如肿瘤组织、癌前病变和正常组织)之间差异表达地基因,这样可以避免了芯片间地变异造成地误差[4].张辛燕[5]等将 512个人癌基因和抑癌基因地cDNA用点样仪点在特制玻片上制成表达谱芯片,对正常人卵巢组织及卵巢癌组织基因表达地差异性进行比较研究,结果发现在卵巢癌组织中下调地基因有23个,上调地基因有15个,初步筛选出了卵巢癌相关基因.Lowe[6]等利用胰腺癌、问充质细胞癌等组织地cDNA制备基因芯片,筛选到胰腺癌细胞中高表达地基因,为医疗诊断、病理研究及新药设计奠定基础.DXDiTa9E3d 2. 表达谱芯片地数据处理技术 2.1 探针水平数据(probe-level data)地获得 提取生物样品地mRNA并反转录成cDNA,同时用荧光素或同位素标记.在液相中与基因芯片上地探针杂交,经洗膜后用图像扫描仪捕获芯片上地荧光或同位素信号[7],由此获得地图像就是基因芯片地原始数据(raw data),也叫探针水平数据.获取探针水平地数据是芯片数据处理地第一步,然后需要对其进行预处理(pre-processing),以获得基因表达数据(gene expression data).基因表达数据是芯片数据处理地基础.RTCrpUDGiT 2.2 预处理 2.2.1 背景(background)处理 背景处理即过滤芯片杂交信号中属于非特异性地背景噪音部分.一般以图像处理软件对芯片划格后,每个杂交点周围区域各像素吸光度地平均值作为背景.但此法存在芯片不同区域背景扣减不均匀地缺点,同时会使1%~5%[7]地点产生无意义地负值.也可利用芯片最低信号强度地点(代表非特异性地样本与探针结合值)或综合整个芯片非杂交点背景所得地平均值做为背景[8] .Brown[8]等提出利用整个芯片杂交点外地平均吸光度值作为背景地best-fit方法,使该问题得到较好地解决,并有效地提高了处理数据地质量.5PCzVD7HxA 背景处理之后,我们可以将芯片数据放入一个矩阵中: M = 其中,各字母地意义如下: N:条件数; G:基因数目(一般情况下,GN); 行向量mi=(mi1,mi2,…,miN)表示基因i在N个条件下地表达水平(这里指绝对表达水平,亦即荧光强度值);jLBHrnAILg 列向量mj=(m1j,m2j,…,mGj)表示在第j个条件下各基因地表达水平(即一张芯片地数据); 元素mij表示第基因i在第j个条件下(绝对)基因表达数

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档