电子社2023大数据分析与挖掘实验教程-课件ch4.pdf

电子社2023大数据分析与挖掘实验教程-课件ch4.pdf

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据分析与挖掘实验教程 2 0 2 3 ——聚类与关联规则挖掘 配套教材 : 《大数据分析与挖掘实验教程》 实 验 目 的 了解聚类与关联规 掌握聚类算法、关 使用Scikit-learn和 则挖掘的概念和应 联规则挖掘的基本 mlxtend进行聚类和 用场景 原理和实现方法 关联规则挖掘的实现 01 概念与应用场景 02 聚类算法的基本原理 CONT ENT 03 基于scikit-learn库实现聚类算法 实验 内容 04 关联规则挖掘的基本原理 :Apriori算法 05 基于mlxtend库实现关联规则挖掘 “ 概 念 与 应 用 场 景 01 聚 类 聚类是一种对数据进行分类和分组的技术 ,其目的是将相似的数据对象归为一类 ,将不相 似的数据对象归为不同的类。聚类可以帮助我们了解数据的内在结构和分布规律 ,发现数据中 的相似性和差异性 ,以及对数据进行可视化和分析。聚类的应用场景非常广泛 ,例如 : Ø 市场细分 :将消费者按照其购买行为和偏好进行分类 ,从而实现有针对性的营销 ; Ø 社交网络分析 :将用户按照其兴趣和行为进行分类 ,从而发现用户之间的联系和社交网 络的结构 ; Ø 图像分割 :将图像中的像素按照其颜色或纹理特征进行分类 ,从而实现图像分割和 目标 检测。 关 联 规 则 挖 掘 关联规则挖掘是一种发现数据之间关联和联系的技术 ,其目的是从数据中发现频繁项集和 关联规则。频繁项集是指在数据集中经常同时出现的一组项 ,关联规则是指一组项之间存在的 关联关系。关联规则可以帮助我们了解数据之间的关联和联系 ,发现数据中的规律和趋势 ,以 及预测未来的趋势和行为。关联规则挖掘的应用场景非常广泛 ,例如 : Ø 购物篮分析 :发现不同商品之间的关联关系 ,从而提高交叉销售和推荐的效果 ; Ø 健康管理 :发现不同健康指标之间的关联关系 ,从而预测疾病的风险和预防措施 ; Ø 交通管理 :发现不同交通指标之间的关联关系 ,从而预测交通拥堵和优化交通路线。 “ 聚 类 算 法 的 基 本 原 理 02 聚 类 算 法 Ø K均值算法 ; Ø 层次聚类算法 ; Ø 其他聚类算法 :DBSCAN算法、谱聚类算法等。 这些算法是聚类领域中的经典算法 ,具有简单、直观、易于实现的特点 ,广 泛应用于实际问题中。 K 均 值 算 法 K均值算法是一种基于距离度量的聚类算法 ,其基本思想是将数据集划分为K个不相交的簇

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档