- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
芯片技术的芯片数据分析
芯片技术的芯片数据分析: 芯片分析概述
随着基因芯片技术的普及,基因表达数据大量产生,如何充分利用这些数据并从中提取有用的生物学知识,是生物信息学所面临的一个迫切问题。简要来说,生物芯片数据分析流程大体可分成以下几个阶段。
扫描与图像识别
一张芯片完成杂交实验,经扫描仪读取后生成图形文件,经过划格(Griding)、确定杂交点范围(Spot Identifying)、过滤背景噪音(Noise Filtering)等图像识别过程,才能最终得到基因表达的荧光信号强度值,并以列表形式输出。
数据预处理
由于杂交荧光标记效率或检出率不平衡、位置效应等多种因素,原始提取信号需要进行均衡和修正处理后,才能进一步分析。这一步通常需要先进行背景校正(Background Correction),去除不均匀背景光强影响,然后再进行归一化(Normalization)处理。 一般来说,对于单色DNA芯片而言,这一步相对容易;而双色DNA芯片则需要考虑不同染料(Cy3、Cy5)对于mRNA染色效率的差异。
数据分析
在前一步基础上,需要根据基因表达状况与事先设定的条件,对基因进行分类处理。具体来说,又可分为寻找差异表达基因和寻找共表达基因两种。 所谓差异表达基因(Differen-tially Expressed Genes),是指在预先设定的不同实验条件下,表达量出现显著差异的基因。而共表达基因(Co-expressed Genes)则是指在不同实验条件下,表达模式或表达量相似的基因。 实践中,在没有先验知识的情况下,一般是通过聚类来寻找这些基因。如果事先已经有了一组明确的训练集,也可以通过分类来寻找与这组基因具有类似表达模式的其他基因。 所谓聚类,也称无监督分类(Un-supervised Classification),是指在未设定先验类别的情况下,根据表达模式或表达值相似程度,将基因划分为若干组。而分类则是指在给定已经先验标明类别(如肿瘤、健康)训练集前提下,根据表达模式或表达值相似程度,将被检基因或样本归入预先设定的类别中。 为确保实验结果可靠性,实际生物学研究中,经常采用RT-PCR之类低通量表达分析手段,对选择出来的基因进行进一步验证。 值得指出的是,以上给出的只是一个大体流程。实际数据分析过程中,经常需要根据前一步分析结果和实际生物学问题来制定下一阶段分析策略。同时,考虑到基因表达动态性和时间相关性,即使对于同一种细胞类型,不同条件下转录表达情况也会有差异。因此,分析基因表达数据时,必须同时参考具体实验条件的描述,通常称这些描述实验条件的数据为元数据(Meta-data)。典型的元数据包括实验方案、实验材料、图像处理方法和数据归一化方法等信息。
芯片分析软件包简介
芯片分析过程繁复,且涉及到复杂的统计计算,需要综合运用多种数学与计算机工具。为方便生物学家研究,相关研究人员已开发了许多专用芯片分析软件。 【1】Bioconductor Bioconductor是基于统计学软件包R的芯片分析软件包,其主要目的是为生物信息学研究人员提供一组表达数据分析工具。Bioconductor的开发起始于2001年,主要由美国Fred Hutchinson肿瘤研究中心、哈佛医学院以及哈佛公共健康研究院开发。 Bioconductor可支持几乎所有主流芯片数据格式,包括Affymetrix公司的商业化单色寡核苷酸芯片,以及用户自己定制的双色cDNA芯片。Bioconductor通过若干子软件包提供多种主流芯片分析方法,可用于数据预处理、差异表达基因识别以及聚类等常用数据分析。除用于芯片数据分析以外,Bioconductor还可用于SAGE、CGHArray以及SNPArray等其他表达数据分析。 Bioconductor的源代码完全开放,用户可以方便查看以及修改现有算法及其具体实现模块。因此,Bioconductor也广泛用作其他芯片分析工具的后台支持。 【2】dChip dChip(DNA-Chip Analyzer)由哈佛大学生物统计系Cheng Li、Wing Wong等联合开发,是综合性芯片分析软件。dChip运行在Windows平台上,包括以下功能: 1) 针对Affymetrix芯片、基于MBEI(Model-based expression indexes)的数据预处理及归一化; 2) 基于样本比较差异基因识别; 3)主成分分析(Principal Component Analysis,PCA); 4) 方差分析(Analysis of Variable,ANOVA); 5) 时间序列(Time Series)分析; 6) 层次聚类(Hierarchical Clusteri
您可能关注的文档
最近下载
- AP预备微积分 2024年真题 附答案和评分标准 AP Pre-Calculus 2024 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 6.3工艺的类别与选择探究金工工艺(课件)-2024--2025学年高中通用技术苏教版(2019)必修.pptx VIP
- 耐药结核病全口服短程治疗专家共识.pptx VIP
- 4.1汉字的起源与演变规律(全国导游基础知识 第五版 ).ppt VIP
- 部编版语文六年级上册第2单元《口语交际:演讲》课件.pptx VIP
- 4.5旅游名联选读(全国导游基础知识 第五版 ).ppt VIP
- Unit 2 My school things Speed up(教学课件)-三年级英语上学期(外研版2024秋).pptx
- 未来五到十年传染病疫情监测与预警系统分析报告2025.docx
- 麟龙四量图通达信指标公式程序.docx VIP
- 大学生入党自传范文2000字范文.doc VIP
文档评论(0)