- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
物联网智能技术张文宇李栋12第十二章课件教学.ppt
PPT研究院 POWERPOINT ACADEMY * * * * * 12.2 数据挖掘和知识发现 * 12.2.1数据挖掘与知识发现的概念、过程及方法 3.数据挖掘的方法 12.2 数据挖掘和知识发现 * 12.2.2 数据仓库 12.2 数据挖掘和知识发现 * 数据仓库的基本体系结构 12.3 常用的数据挖掘方法 * 12.3.1 关联规则 关联规则及关联规则挖掘: 关联规则(association rule)挖掘就是在数据库中进行关联分析,是数据挖掘的众多方法中最为典型的一种。 定义12.1 事务、项目:关联规则挖掘的数据集,记为D(一般为事务型数据库), 称为事务(transactions),im(m=1,2…,n)称为项目(item) 12.3 常用的数据挖掘方法 * 12.3.1 关联规则 定义12.2 项目集、k—项目集:设 是D中全体项目组成的集合,I的任何子集X称为D中的项目集(itemset),若有|X|=k,则称集合X为k项目集(k-Itemset)。 设tk和X分别为D中的事务和项目集,如果 ,称事务 包含项目集X。 12.3 常用的数据挖掘方法 12.3.1 关联规则 定义12.3 关联规则、规则前件、规则后件:关联规则是描述数据集D中数据项目之间存在的潜在关系的规则,形式为X Y,其中 , ,且 ,X称为规则前件,Y称为规则后件。项集之间的关联表示:如果X出现在一条事务中,那么Y在该事务中同时出现的可能性比较高。 * 12.3 常用的数据挖掘方法 * 12.3.1 关联规则 定义12.4 支持数、支持度:项目集X在数据集D中的支持数是D中包含X的事务数,记做X.count;项目集X在数据集D中的支持度是X的支持数与D中总事务数之比,记做support(X),则有 ,其中{D}是数据集D中的总事务数。 12.3 常用的数据挖掘方法 12.3.1 关联规则 定义12.5 置信度:关联规则X Y的置信度是数据集D中包含 的事务数与包含X的事务数之比,记为confidence(X Y),即 * 12.3 常用的数据挖掘方法 * 关联规则挖掘的主要任务就是在事务数据库D中挖掘出所有的强关联规则,即在D中找出所有具有用户指定最小支持度和最小置信度的关联规则。 12.3 常用的数据挖掘方法 * 关联规则挖掘的步骤 12.3 常用的数据挖掘方法 * 关联规则挖掘的算法 12.3 常用的数据挖掘方法 * 12.3.2 时间序列分析 时间序列数据挖掘的目的就是从时间序列中检测出用户感兴趣的模式,这些模式可以帮助人们更好地认识时间序列中蕴含的规律,加深人们对时间序列背后的系统和现象的理解。 12.3 常用的数据挖掘方法 * 12.3.2 时间序列分析 定义12.7 一组时间序列数据是指一系列记录集, N为序列值的个数,其中每个记录为m+l维数据,即 ai为特性值,可以是连续实数也可以是离散数据,可以与时间有关联也可以没有。如果某特性值与时间有关,则该特性值为动态特性,否则为静态特性,一般时间序列的研究主要是针对动态特性。 12.3 常用的数据挖掘方法 12.3.2 时间序列分析 定义12.8 对于定义12.7中的特性值ai可以定义为特性函数fi,其fi是时间的函数,函数的系数可以从特性值ai中得到,其函数表达式为 ,其中 。 * 12.3 常用的数据挖掘方法 * 趋势分析 时序序列可以用时序序列图来表示,它描述了数据序列随时间变化的情况 12.3 常用的数据挖掘方法 * 时序分析中的相似搜索 时序分析中的相似搜索有以下几种基本方法 12.3 常用的数据挖掘方法 * 序列模式挖掘 序列模式挖掘(sequence pattern matching)是指挖掘相对时间或其他模式出现频率高的模式。 周期分析 周期分析是指对周期模式的挖掘,即在时序数据库中找出重复出现的模式。周期模式可以应用于许多重要的领域。 12.3 常用的数据挖掘方法 * 周期模式挖掘的问题可分为三类 12.3.3 聚类分析 * 聚类算法大体上可分为以下几类方法: 划分方法:给定一个具有n个对象或元组的数据集,由划分方法构建数据的k个划分,每个划分表示一个聚类,并且k?n。也就是说,它将数据划分为k个组,同时满足如下要求: (1)每个组至少包含一个对象。 (2)每个对象必须属于且只属于一个组 绝大多数应用中主要采用以下两个比较流行的启发式算法: (1)k-means算法(k平均算法),该算法中,每个簇用该簇中对象的平均值来表示。 (2)k-medoids算法(k中心点算法),在该算法中,
您可能关注的文档
- 物流运输组织与管理第3版万耀明第六章普通零担货物运输组织课件教学.ppt
- 物流运输组织与管理第3版万耀明第十一章物流运输的质量管理课件教学.ppt
- 物流运输组织与管理第3版万耀明第十章联合运输课件教学.ppt
- 物流运输组织与管理第3版万耀明第四章整车运输组织课件教学.ppt
- 物流配送中心规划与设计第3版贾争现第2章基本资料的收集与分析课件教学.ppt
- 物流配送中心规划与设计第3版贾争现第4章物流配送中心的系统规划课件教学.ppt
- 物流配送中心规划与设计第3版贾争现第5章物流配送中心的设备规划课件教学.ppt
- 物流配送中心规划与设计第3版贾争现第7章物流配送中心信息系统规划课件教学.ppt
- 物流配送中心规划与设计第3版贾争现第8章物流配送中心的基本作业管理课件教学.ppt
- 物流配送中心规划与设计第3版贾争现第9章物料搬运系统的分析与设计课件教学.ppt
- 【浙商-2026研报】ESG及绿色金融月报:中国ESG政策体系多维提速,欧盟监管趋严与弹性调整并举.pdf
- 【东兴-2026研报】石油石化行业:原油价格下降,中国原油进口数量提升.pdf
- 【东吴-2026研报】宏观深度报告:“该省省、该花花”中国消费的“K型分化”.pdf
- 【国新-2026研报】计算机行业周报:DeepSeek提出全新mHC架构.pdf
- 【开源-2026研报】中通客车(000957):公司首次覆盖报告:客车行业老牌玩家,出口助力业绩迈向新台阶.pdf
- 【红塔期货-2026研报】2026年1月双焦基本面月报.pdf
- 【中邮-2026研报】商业航天系列专题之卫星篇(1):梳理中国星座计划.pdf
- 【山西-2026研报】山西证券研究早观点.pdf
- 【山西-2026研报】非银行金融行业周报:不动产REITs规则明确,关注板块投资价值.pdf
- 【江海-2026研报】A股市场快照:宽基指数每日投资动态2026.01.08.pdf
原创力文档


文档评论(0)