- 48
- 0
- 约4.88万字
- 约 65页
- 2017-01-28 发布于重庆
- 举报
基于Eclat算法的海量数据库.
摘 要
数据挖掘一般是指从大量的数据中通过算法发现隐藏于其中信息的过程。关联规则是数据挖掘的重要研究及应用领域,近几年,许多学者对关联规则挖掘做了大量的研究,关联规则主要用于发现数据库中不同属性或者不同数据项之间的关联关系。随着“大数据”时代的到来,人们也越来越关注对关联规则的研究。本文在前人的基础上,进行了一些关于提高关联规则挖掘算法性能和功能完善的研究工作。
本文首先总结了关联规则挖掘算法的研究成果,分析了AIS、Apriori、FP-Growth等算法的实现方式以及特点,通过对经典算法的分析为提出性能更优、更易实现的挖掘算法做好理论方面的准备。本文提出基于数据垂直分布的深度优先关联规则挖掘算法DS-Eclat(Directed Segmenting-Eclat),采用关联矩阵描述数据项间的关联关系,并利用关联矩阵约束候选项集的产生;同时,采用深度优先的挖掘模式,提高生成K-频繁项集的效率。该算法另一个创新点在于对数据进行有向分割,并通过连接得到最大频繁项集。该算法利用布尔矩阵存储频繁项集支持集,减小了内存开销,而且改进算法不需要对数据库进行多次扫描,大幅降低了系统I/O的负载,同时也减少了候选项集的产生。
依据关联规则,实现了DS-Eclat算法在图书馆管理系统中的应用。对各类图书之间的关联规则进行挖掘,实验结果表明各类图书之间具有关联性,并得出五类(即C、I、O、P及T)具
您可能关注的文档
- 地质实习报告参考..doc
- 地震对桥梁破坏及机理分析..doc
- 地震安评一级考试大纲以及解答..doc
- 地铁钢支撑安装拆卸方案..doc
- 地质雷达法检测隧道衬砌施工质量技术总结..docx
- 地震的预测与防范..doc
- 地铁风险评估报告..docx
- 地面硬化对樟树生长的影响..doc
- 场(厂)内专用机动车辆作业人员考核大纲..doc
- 场地土剪切波速测试报告..doc
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
原创力文档

文档评论(0)