系统生物学软件_专题二_2009级技术班20130314.ppt

系统生物学软件_专题二_2009级技术班20130314.ppt

专题二 芯片分析软件 Expander 芯片数据来源 数据库中的记录种类1: 平台(Platform):描述芯片的特性,如寡核苷酸探针组,cDNA, 抗体等。一个平台可以被不同样本、不同系列引用。平台登录号的首字母为“GPL”。 样本(Sample):描述了样本是如何从未处理状态到形成最后的提交数据,包括经过何种处理,处理方式,如何从中提取待测生物分子,生物分子如何被标记,如何杂交,如何扫描,原始数据经过何种处理转化为提交数据,以及最后提交结果中每种分子的测量值。一个样本只能引用一种平台,却可以被多个系列引用。样本登录号的首字母为“GSM”。 系列(Series):包括一组相关的样本,以及对整个研究的介绍。一个系列可以引用多个样本,可以引用多个平台。系列登录号的首字母为“GSE”。 数据库中的记录种类2: 数据集(Dataset):是由系列整理后形成的,一个系列可以形成一个或者多个数据集。一个数据集只引用一个平台,且经过处理后,同一个数据集内的不同芯片间同一个基因的值是可以直接比较的。数据集登录号首字母是“GDS”。 表达谱(Profile):从数据集中抽取的,一个基因在不同个样本中的表达值组成的数组。 芯片数据预处理步骤 1. 背景校正(Background Correction); 2. 标准化(Normalization); 3. 合并(Summary). 表达谱

文档评论(0)

1亿VIP精品文档

相关文档