培训课件_生物医学数据挖掘.pptVIP

  • 5
  • 0
  • 约6.86千字
  • 约 88页
  • 2016-11-22 发布于浙江
  • 举报
3.1回归分析的功能 3.2常用的回归分析方法 3.2.1线性回归 3.2.2Logistic回归 3.2.3人工神经网络 3.2.4回归树 第四章 分类 第五章 聚类分析 5.1聚类分析的功能 5.1.1聚类分析的定义与作用 聚类是一种数据分析方法,它面向一个数据集,将其中全体数据分别划归不同组别。 聚类依据原则:同一类别内的各个数据相似性较高,不同类之间的数据相似性较低。 聚类作用:可根据其内在属性将数据归纳为不同的类别,并借此了解数据属性的分布规律;也可作为数据预处理的手段,为实施其他数据挖掘技术进行数据准备。 5.1.2聚类分析中的相似性度量 1、由特征属性确定的相似性 2、数值型数据之间的相似性 3、二值型数据之间的相似性 4、分类型数据之间的相似性 5、排序型数据之间的相似性 6、混合型数据之间的相似性 例:现有若干个样本根据由6个特征属性构成,特征属性的名称及各样本数据的相应特征值如表,计算各个样本数据之间的相似程度。 记录 性别 年龄组 收缩压 舒张压 糖尿病类型 心绞痛 1 1 2 200 120 1 0 2 0 3 180 105 2 1 3 1 1 110 80 0 0 … … … … … … … 5.2聚类分析的方法 5.2.1聚类分析方法 1、划分法 第一步:任选k个样本数据 第二步:进行第一轮聚类 第三步:进行第二轮聚类 第四步:计算聚类误差E 2

文档评论(0)

1亿VIP精品文档

相关文档