- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章现代数据挖掘技术知识与发展 《数据仓库原理设计与应用》课件.ppt
第6章现代数据挖掘技术与发展 本章学习目标: (1) 通过知识挖掘系统的体系结构的学习掌握知识发现的定义和知识发现系统的结构 。 (2) 通过现代挖掘技术及应用的学习掌握规则型、神经网络型、遗传算法型、粗糙集型和决策树型现代挖掘技术。 (3) 通过知识发现工具与应用的学习掌握知识挖掘工具的系统结构、运用中的问题和知识挖掘的价值。 (4) 经过数据挖掘技术的发展的学习了解文本挖掘、Web挖掘、可视化数据挖掘、空间数据挖掘和分布式数据挖掘。 现代数据挖掘技术与发展 6.1知识挖掘系统的体系结构 6.2现代挖掘技术及应用 6.3知识发现工具与应用 6.4数据挖掘技术的发展 练 习 6.1知识挖掘系统的体系结构 6.1.1知识发现的定义 ·知识发现是用一种简洁的方式从大量数据中抽取信息的一种技术,所抽取的信息是隐含的、未知的,并且具有潜在应用价值。 ·知识发现可看成是一种有价值信息的搜寻过程,它不必预先假设或提出问题,仍然能够找到那些非预期的令人关注的信息,这些信息表示了不同研究对象之间的关系和模式。它还能通过全面的信息发现与分析,找到有价值的商业规则。 ·知识发现意味着在数据仓库或数据集市的几千兆、几万兆字节数据中寻找预先未知的商业模式与事实。 6.1.2 知识发现系统的结构 知识发现系统的结构由知识发现系统管理器、知识库、商业分析员、数据仓库的数据库接口、数据选择、知识发现引擎、知识发现评价和知识发现描述等部分组成(图6.1)。 数据仓库 知识库 数据库接口 数据选择 知识发现引擎 知识发现评价 知识发现描述 知识发现管理器 商业分析员 图6.1 知识发现系统结构 1.知识发现系统管理器 控制并管理整个知识发现过程 2.知识库和商业分析员 知识库包含了源于各方面的知识。商业分析员要按一种有效的方式指导关注信息的发现。 3.数据仓库的数据库接口 知识发现系统的数据库接口可以直接与数据仓库通信。 4.数据选择 确定从数据仓库中需要抽取的数据及数据结构 5.知识发现引擎 将知识库中的抽取算法提供给数据选择构件抽取的数据 6.发现评价 有助于商业分析员筛选模式,选出那些关注性的信息 7.发现描述 发现、评价并辅助商业分析员在知识库中保存关注性发现结果以备将来引用,并保持知识发现与管理人员的通信。 3.关联规则的算法 Apriori算法 1.找出所有支持度大于最小支持度的项集,这些项集称为频集,包含k个项的频集称为k-项集。 2.使用第1步找到的频集产生所期望的规则。 Apriori算法的第1步采用了递归方法,算法表示为 L1={large 1-itemsets};//产生频繁1项集L1 for (k=2;Lk-1≠○;k++) do //循环产生频繁2项集L2直到某个r使Lr为空 begin Ck=apriori-gen(Lk-1);//产生k-项集的候选集 for all transactions t∈D do begin Ct=subset(Ck,t);//事务t中包含的候选集 for all candidates c∈Ct do c.count++; end Lk={c∈Ck|c.count≥minsup} end Answer=UkLk 第2步算法较为简单。如果只考虑规则的右边只有一项的情况,给定一个频集Y=I1,I2,I3,…,Ik,k≥2,Ij∈I,那么只有包含集合{ I1,I2,I3,…,Ik}中的项的规则最多有k条。这种规则形如I1,I2,I3,…Ii-1,Ii+1…,Ik→Ii,。这些规则置信度必须大于用户给定的最小置信度。 数据库D C1 L1 事务标识 项集 项集 支持度 项集 支持度 A1 1,3,4 扫描数据 库D {1} 2 {1} 2 A2 2,3,5 {2} 3 比较 支持度 {2} 3 A3 1,2,3,5 {3} 3 {3} 3 A4 2,5 {4} 1 {5} 3 {5} 3 由L1产生C2 C2 L2 项集 项集 支持度 项集 支持度 {1,2} 扫描数据 库D {1,2} 1 {1,2} 2 {1,3} {1,3} 2 比较 支持度 {2,3} 2 {1,5} {1,5} 1 {2,5} 3 {2,3} {2,3} 2 {3,5} 2 {2,5} {2,5} 3 {3,5} {3,5} 2 项集 扫描数据 库D 项集 支持度 {2,3,5} {2,3,5} 2 由L2产生C3 L3 4.关联规则
您可能关注的文档
- 第6章 通风和 与空调系统 《建筑设备工程》.ppt
- 第6章 防火墙技术知识 网络维护与安全技术知识教程与实训电子教案.ppt
- 第6章 隧道施工组织设计与施工相关管理 《隧道工程施工》.ppt
- 第6章 食品良好操作规范(GMP) 食品质量安全相关管理和监督 .ppt
- 第6章 FX2N 系列PLC的步进指令及顺序功能图《电气控制和 与PLC系统》课件.ppt
- 第6章 LabVIEW面向对象程序的设计 lab view 课件.ppt
- 第6章 Microsoft Project 2010与IT项目成本计划 项目相关管理与IT项目相关管理课件.ppt
- 第6章 三相交流电路 《电工电子技术知识(上、下册)》课件.ppt
- 第6章 业务流程再造 《业务流程相关管理》课件.ppt
- 第6章 中断系统 单片机原理和 与实践指导课件.ppt
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
最近下载
- 2024年上半年教师资格证考试《初中语文》真题.docx
- 耳鼻喉科考试题及答案.docx VIP
- 超星尔雅学习通《组织行为学》章节测试答案满分版.doc
- 高中数学椭圆、双曲线抛物线综合练习题及答案-.pdf VIP
- 2024 巡察整改专题民主生活会个人对照检查材料.docx VIP
- 2024年上半年教师资格证考试《初中语文》真题.pdf
- 基于Modbus总线的马铃薯贮藏库温湿度采集.doc VIP
- 2025年全国保密教育线上培训考试试题库及完整答案【全优】.docx VIP
- 2024年上半年教师资格证考试《教育知识与能力》(中学)真题.pdf
- 晓磊(CHXL)Lei3000变频器说明书用户手册.pdf
文档评论(0)