- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
河南大学研究生硕士学位论文
河南大学研究生硕士学位论文 第J页
摘 要
关联规则是最常见的知识表示方法之一,频繁项集挖掘是关联规则挖掘中的 重要课题,它已经被广泛的应用于各个领域。概念格是一个非常有用的形式分析 工具,通过I-Ias∞图它可以生动、简洁的表现这些概念之间的泛化和特化关系。另 外,概念格中的每个节点本质上是一个频繁项目集,并且频繁项集和概念格的内 涵之间有一种一一对应的关系。因此,利用概念格来挖掘频繁项集和关联规则显 得水到渠成。基于概念格的频繁项集与关联规则的挖掘,很多学者对此已经进行 了深入的研究并取得了很大的进步,但大部分都是假定由属性组成概念格中内涵 的重要性均匀平等、同等重要,而基于这种思想的概念格提取关联规则存在着明 显的不足:(1)这将导致组合爆炸和冗余问题;(2)由于建格时没有考虑到属性 重要性的差别,形成包含所有属性的概念格的结点,因此建格时间长、效率低。
针对以上不足,本文首先提出一个新的概念——内涵区别度,基于内涵区别 度来建造概念格将有力的减少格中的频繁项集的数量,主要原因是区别度低的内 涵将不参与格的构造,这在一定的程度上缓和了组合爆炸的问题,使关联规则提 取的难度系数也有所降低。其次本文给出了基于内涵区别度的格的构造算法,不 再是建造概念格的每一个节点都扫描数据库,而是有条件的扫描数据库并计算和 重置区别度的值,这就减少了数据库扫描的次数,从而减少了生成概念格的时间, 提高效率。另外,改进了基于概念格的关联规则提取的算法,将置信度剪枝的概 念引入基于概念格的关联规则提取中,减少了关联规则提取时置信度计算的时间, 从而有效的提高了关联规则提取的效率,最后将本文提出的改进算法应用了基于 区别度概念格的关联规则提取中,并给出了相应的提取算法。基于概念格的关联 规则的挖掘关键在于概念格的构造,首先将频繁项集和内涵区别度存储在格上, 然后在创建好的概念格上根据规则生成关联规则。
本文的主要贡献如下:
第Jl页
第Jl页 河南大学研究生硕士学位论文 1)提出内涵区别度的概念,基于内涵区别度建造概念格将有力的减少频繁项
集的数目,缓和组合爆炸的问题; 2)给出了基于区别度概念格的频繁项目集提取算法,在构造概念格时不再每
一个节点的生成都扫描数据库,减少了扫描数据库的次数,提高了时间效
率;
3)改进了基于概念格的关联规则提取的算法,将置信度剪枝的概念引入基于 概念格的关联规则提取中,从而有效的提高了关联规则提取的效率;
4)将本文提出的改进算法应用了基于区别度概念格的关联规则提取中,并给 出了相应的提取的算法。
关键词:关联规则;内涵区别度;概念格;置信度
河南大学研究生硕士学位论文
河南大学研究生硕士学位论文 第ll I页
Abstract
Association rules is one of the most knowledge representation methods,frequent pattern mining as a fundamental data mining task has widespread applications in many different domains.Concept lattice is a very useful formal analysis tool and call show the
relationship among the concepts vividly and briefly.In addition,every node in the
concept lattices is a frequent itemsets,and there is a one-to-one correspondence between concept intensions and frequent itemsets.Abundant literate has been conducted in-depth research in mining frequent itemsets and association rules based on the concept lattice. However,most of them did not take into account the differences of attributes when concept lattice is build.There are two obvious deficiencies based on this idea:(1)It will
lead to the issues of combinatorial explosion and redundancy;(2)It n
您可能关注的文档
- 基于遗传算法的自动组卷系统研究与实现-管理科学与工程专业论文.docx
- 基于数据挖掘的电信客户流失成因研究-软件工程专业论文.docx
- 基于网络化虚拟仪器的单纱强力仪研究-纺织材料与纺织品设计专业论文.docx
- 基于条件粒度熵的不完备信息系统的动态约简研究-数学专业论文.docx
- 基于无线网络的动态心电监护系统-控制理论与控制工程专业论文.docx
- 基于稀疏约束的图像超分辨率重建技术研究-信号与信息处理专业论文.docx
- 基于时频分析的结构损伤诊断-结构工程专业论文.docx
- 基于图像技术的可自动调节高度睡枕系统研究-计算机应用技术专业论文.docx
- 基于遗传算法的QoS组播路由-计算机系统结构专业论文.docx
- 基于数据仓库的物流信息系统-软件工程专业论文.docx
- 基于网络环境的电子商务系统认证和安全交易技术的研究-计算机应用技术专业论文.docx
- 基于突变理论的土钉支护体系的稳定分析研究-防灾减灾工程及防护工程专业论文.docx
- 基于土地利用的城市交通需求分析研究-交通运输规划与管理专业论文.docx
- 基于神经网络和专家系统的智能故障诊断系统研究-测试计量技术及仪器专业论文.docx
- 基于网络的高校综合教务管理系统的研究与设计实现-教育技术学专业论文.docx
- 基于稀疏表示的图像超分辨率重构技术研究-信号与信息处理专业论文.docx
- 基于人工神经网络和小波分析技术的基因表达谱数据分析-电路与系统专业论文.docx
- 基于无形资产的山东中小企业核心竞争力培育-企业管理专业论文.docx
- 基于利基营销战略的我国中小企业的发展思路研究-企业管理专业论文.docx
- 基于人工神经网络的海洋平台损伤诊断技术研究-海洋工程结构专业论文.docx
文档评论(0)