商业数据分析(第3版)第4章.pptxVIP

  • 1
  • 0
  • 约 44页
  • 2023-07-19 发布于安徽
  • 举报
根据相关教材和网络资源整理制作,可作为授课教师的教学参考资料。

描述性数据挖掘第4章 引言数据挖掘技术在商业领域应用的增长,主要得自于三个方面:产生和电子追踪的数据量爆发式增加数据电子储存的能力扩张计算机分析数据的承载功能大大增强 引言观测又叫记录,是指与单个实体有关的变量记录值的集合,经常表现为电子表格或数据库中的一行一行的数值。无监督学习方法:描述性数据挖掘技术,其目标是使用变量的值识别观察之间的关系。 被认为是高维描述性数量解析不需要清晰地说出结果(或者是客观上知晓的结果),不需要界定测量的精度,取而代之的是诉诸于定性评价,比如无监督学习方法得到的结论与专家判断在多大程度上吻合。 聚类分析相似度测量分层聚类k均值聚类分层聚类与k均值聚类的比较 聚类分析聚类的目的是对观测变量将其观察值分割为相似的组。在数据预处理环节中,可以运用聚类来识别被聚合或删除的变量和观察值。在市场营销中,通常会运用聚类方法将消费者分为不同的同质组,该过程就是我们所熟知的所谓市场细分。聚类分析还可以用来识别异常值,这些异常值在加工制造场合中,可能反映着质量控制出现的问题,在金融交易中可能反映了欺骗性行为。 聚类分析聚类方法:其一是分层聚类(又叫系统聚类),这是一种自下而上的聚类方法,开始时把每项观察都各自作为一类,而后循序渐进地合并最相似的类,以创建一系列嵌套式的聚类。其二是是k-均值聚类,即在某种程度上将每个观察值分配到k个类中的某一个类中,以使同一类中的观察值尽可

文档评论(0)

1亿VIP精品文档

相关文档