重大疾病相关数据库.pptVIP

  • 30
  • 0
  • 约 52页
  • 2016-02-06 发布于湖北
  • 举报
重大疾病相关数据库.ppt

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 对数转换 数据过滤 补缺失值 数据标准化 倍数法(Fold change) t检验法(t test) SAM (significance analysis of microarrays) 聚类的目的 对基因进行聚类 对样本进行聚类 基于物体的相似性将物体分成不同的组 样本 基因 基因表达谱 识别功能相关的基因 识别基因共表达模式 质量控制 检查样本是否按已知类别分组 发现亚型 距离尺度函数 欧式距离 Pearson相关系数 Spearman秩相关系数 互信息 聚类算法 层次聚类 Hierarchical Clustering 层次聚类算法将研究对象按照它们的相似性关系用树形图进行呈现,进行层次聚类时不需要预先设定类别个数,树状的聚类结构可以展示嵌套式的类别关系。 聚类算法 层次聚类 Hierarchical Clustering 2000年Alizadeh等运用基因芯片数据,基于层次聚类算法证实了DLBCL肿瘤病人在mRNA层面确实存在两种亚型 聚类算法 k-均值聚类 k-means Clustering k近邻分类法 k-nearest neighbour cla

文档评论(0)

1亿VIP精品文档

相关文档