数据挖掘挖掘频繁模式关联和相关参考.pptVIP

下载本文档

9
0
约1.57万字
约 89页
2018-03-15 发布于贵州
举报
版权申诉

数据挖掘挖掘频繁模式关联和相关参考.ppt

1、本文档共89页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据挖掘挖掘频繁模式关联和相关参考

第九章数据挖掘的应用和发展趋势 9.1 复杂数据对象的多维分析和描述性挖掘 9.2 空间数据挖掘 9.3 多媒体数据挖掘 9.4 时序数据和序列数据的挖掘 9.5 文本数据库挖掘 9.6 Web挖掘 9.1 复杂数据对象的多维分析和描述性挖掘结构化数据的概化空间和多媒体数据概化中的聚集和近似计算对象标识符和类/子类层次的概化类复合层次的概化对象立方体的构造与挖掘用分而治之方法对规划数据库进行基于概化的挖掘 9.2 空间数据挖掘空间数据立方体构造和空间OLAP 空间关联分析空间聚类方法空间分类和空间趋势分析光栅数据库挖掘 9.3 多媒体数据挖掘多媒体数据的相似性搜索基于颜色直方图的特征标识；多特征构成的特征标识；基于小波的特征标识；带有区域粒度的小波特征表识多媒体数据的多维分析多媒体数据的分类和预测分析多媒体数据中的关联规则挖掘 9.4 时序数据和序列数据的挖掘趋势分析长期或趋势变化；循环变动或循环变化；季节性变动或季节性变化；非规则或随机变化时序分析中的相似搜索序列模式挖掘周期分析挖掘全周期模式；挖掘部分周期模式；挖掘循环或周期关联规则。 9.5 文本数据库挖掘文本数据分析和信息检索研究大量文本文档的信息组织和检索基本度量：查准率；查全率。文本挖掘：基于关键字的关联和文档分类 9.6 Web挖掘挖掘Web链接结构，识别权威Web页面 Web文档的自动分类多层Web信息库的构造 Web使用记录的挖掘第十章数据挖掘的应用和发展趋势 10.1 数据挖掘的应用 10.2 数据挖掘系统产品和研究原型 10.3 数据挖掘的其他主题 10.4 数据挖掘的社会影响 10.5 数据挖掘的发展趋势 10.1 数据挖掘的应用针对生物医学和DNA数据分析的数据挖掘针对金融数据分析的数据挖掘零售业中的数据挖掘电信业中的数据挖掘 10.2 数据挖掘系统产品和研究原型怎样选择一个数据挖掘系统数据类型；系统问题；数据源；数据挖掘的功能和方法；数据挖掘系统和数据仓库系统的结合；可伸缩性；可视化工具；数据挖掘查询语言和图形用户接口。商用数据挖掘系统的例子 Intelligent Miner: IBM Enterprise Miner :SAS; MineSet SGI; Clementine SPSS; DBMiner DBMiner Technology 10.3 数据挖掘的其他主题可视化数据挖掘数据可视化；数据挖掘结果可视化；数据挖掘过程可视化；交互式的数据挖掘视频和音频数据挖掘科学和统计数据挖掘数据挖掘的理论基础数据挖掘和智能查询应答例10.1 10.4 数据挖掘的社会影响数据挖掘是宣传出来的还是持久的稳定增长的商业数据挖掘只是经理的事还是每个人的事数据挖掘对隐私或数据安全构成威胁么？ 10.5 数据挖掘的发展趋势应用的探索可伸缩的数据挖掘方法数据挖掘与数据库系统、数据仓库系统和WEB数据库系统的集成数据挖掘语言的标准化可视化数据挖掘复杂数据类型挖掘的新方法 WEB挖掘数据挖掘中的隐私保护与数据信息安全 Chapter 8. 聚类分析什么是聚类分析? 聚类分析中的数据类型主要聚类分析方法分类划分方法（Partitioning Methods）分层方法基于密度的方法基于表格的方法基于模型（Model-Based）的聚类方法异常分析总结划分方法: 基本概念划分方法: 将一个包含n个数据对象的数据库组织成k个划分（k=n），其中每个划分代表一个簇（Cluster）。给定一个k，要构造出k个簇，并满足采用的划分准则：全局最优:尽可能的列举所有的划分；启发式方法: k-平均和k-中心点算法 k-平均 (MacQueen’67):由簇的中心来代表簇； k-中心点或 PAM (Partition around medoids) (Kaufman Rousseeuw’87): 每个簇由簇中的某个数据对象来代表。 K-平均算法给定k，算法的处理流程如下: 1.随机的把所有对象分配到k个非空的簇中； 2.计算每个簇的平均值，并用该平均值代表相应的簇； 3.将每个对象根据其与各个簇中心的距离，重新分配到与它最近的簇中； 4.回到第二步，直到不再有新的分配发生。 K-平均算法例子 K-平均算法优点相对高效的: 算法复杂度O(tkn), 其中n 是数据对象的个数, k 是簇的个数, t是迭代的次数，通常k, t n. 算法通常终止于局部最优解；缺点只有当平均值有意义的情况下才能使用，对于类别字段不适用；必须事先给定要生