- 1
- 0
- 约 44页
- 2023-07-19 发布于安徽
- 举报
根据相关教材和网络资源整理制作,可作为授课教师的教学参考资料。
描述性数据挖掘第4章
引言数据挖掘技术在商业领域应用的增长,主要得自于三个方面:产生和电子追踪的数据量爆发式增加数据电子储存的能力扩张计算机分析数据的承载功能大大增强
引言观测又叫记录,是指与单个实体有关的变量记录值的集合,经常表现为电子表格或数据库中的一行一行的数值。无监督学习方法:描述性数据挖掘技术,其目标是使用变量的值识别观察之间的关系。 被认为是高维描述性数量解析不需要清晰地说出结果(或者是客观上知晓的结果),不需要界定测量的精度,取而代之的是诉诸于定性评价,比如无监督学习方法得到的结论与专家判断在多大程度上吻合。
聚类分析相似度测量分层聚类k均值聚类分层聚类与k均值聚类的比较
聚类分析聚类的目的是对观测变量将其观察值分割为相似的组。在数据预处理环节中,可以运用聚类来识别被聚合或删除的变量和观察值。在市场营销中,通常会运用聚类方法将消费者分为不同的同质组,该过程就是我们所熟知的所谓市场细分。聚类分析还可以用来识别异常值,这些异常值在加工制造场合中,可能反映着质量控制出现的问题,在金融交易中可能反映了欺骗性行为。
聚类分析聚类方法:其一是分层聚类(又叫系统聚类),这是一种自下而上的聚类方法,开始时把每项观察都各自作为一类,而后循序渐进地合并最相似的类,以创建一系列嵌套式的聚类。其二是是k-均值聚类,即在某种程度上将每个观察值分配到k个类中的某一个类中,以使同一类中的观察值尽可
您可能关注的文档
最近下载
- 医院平疫结合通风设计.pptx VIP
- 国企领导班子及个人2026年学习教育查摆问题清单(四大方面)两篇.docx VIP
- 2023年计划生育协会面试真题及解析(19日上午).docx VIP
- 平疫结合传染病医院建设探究.pptx VIP
- 方舱医院应急改造及平疫转换设计导则.pdf VIP
- 体育社会学历年试题库及答案.docx VIP
- 江苏省盐城市东台市第五教育联盟2025-2026学年八年级上学期9月月考语文试题(解析版).docx
- 2026年《体育社会学》复习考试题库及答案(含各题型).pdf VIP
- 2026最新团校入团考试历年真题150题汇编(打印版含答案).docx
- 中外合作办学协议书范本8篇.docx VIP
原创力文档

文档评论(0)