交互式关联规则挖掘的研究和应用-计算机软件与理论专业论文.docxVIP

  • 3
  • 0
  • 约3.95万字
  • 约 55页
  • 2019-02-14 发布于上海
  • 举报

交互式关联规则挖掘的研究和应用-计算机软件与理论专业论文.docx

交互式关联规则挖掘的研究和应用-计算机软件与理论专业论文

algorithm algorithm translates the Boolean expression of rule constraints into the corresponding Boolean expressions of set constraints. Secondly,the algorithm searches the frequent set in the equivalent classes using the approach of the expansion of minimal frequent set.Thirdly,according to the produced set of frequent sets and the rule constraints,the algorithm produces the association rules.In the end,the paper gives an application of IgAR to an education system. Key words:Association Rule; Interactiveness: Constraints;Data Mining; Concept Lattice. 11 河海大学硕士学位论文第一章绪论 河海大学硕士学位论文 第一章绪论 1.1引言 今天的人们在拥有了大量的数据的基础上迫切希望将这些数据转化为有用 的知识和信息。数据挖掘——一个新兴学科一在这样的背景下产生了并迅速 成为信息科学中的热门研究领域,受到广泛的关注。 数据挖掘是信息科学革命性发展的直接结果。从信息科学的发展历程来看, 首先成熟的是以文件系统为代表的数据采集技术。当数据的采集不再是问题以 后,对数据的处理(包括存贮,检索等等)就成为了系统的瓶颈。于是数据库技术 应运而生。数据库技术成功地解决了上述问题后,人们就希望能够对数据进行更 好的分析和理解。这样就产生了数据仓库和在线数据分析(oLAP)技术【“21。这些 技术部分地解决了人们的需求。比如0LAP的工具支持多维分析,一定范围内的 决策支持等等【2’3l。 但人们还需要对数据做出更深入的分析f如数据的分类、聚类、特征等等)。 以难以想象的高速度收集的大量数据被存贮在超大规模的数据库中,远远超出了 人们能理解它的能力,这被称为“数据丰富而信息贫乏”。结果是数据库往往变 成了“数据的坟墓”,很少被人访问,决策更多地不是依赖信息,而是依赖决策 者的直觉。数据挖掘就是要改善“数据丰富而信息贫乏”的情况,将“数据的坟 墓”变成隐藏着知识的“金矿”【钔。 数据挖掘就是从大量原始数据中提取人们感兴趣的、隐含的、尚未被发现的、 有用的信息和知识【51,使它们可以有利于指导决策支持,其提取的知识可以表示 为概念、规则、规律、模式等形式,是当今数据库和人工智能相互结合的最前沿 和极富应用前景的研究领域,己引起了国内外众多学者和业界的高度重视,对数 据挖掘的方法论、理论和工具开展了广泛深入的研究工作。根据挖掘任务数据挖 掘可分为:分类、聚类分析、关联规则、序列模式发现、回归分析等16。7J。在这 些数据挖掘任务中,关联规则挖掘是其中的最为流行、研究尤为深入和广泛的一 种应用之一。 关联规则挖掘于1993年由Agrawal[8。9’10’11】等人在对市场购物篮问题进行分 析时首次提出,用以发现商品销售中的顾客购买模式。关联规则挖掘可以发现存 在于数据库中的项目或属性间的有趣关系,这些关系是预先未知的和被隐藏的。 河海大学硕士学位论文所发现的关联规则可以辅助人们进行市场运作、决策支持及商业管理,网站设计 河海大学硕士学位论文 所发现的关联规则可以辅助人们进行市场运作、决策支持及商业管理,网站设计 等各个领域[12J。 本文也是对关联规则挖掘在教育领域的一个应用,在中学生智能评估系统中 有大量的关于现在和过去学生的资料,包括学习成绩、思想道德表现、行为表现、 奖惩情况等等,在数据比较完备的前提下,原有系统㈣“l主要通过Apriofi算法 【8一一5l实现关联规则数据挖掘,用户只能绘出支持度和可信度两个约束值,系统 和用户交互的程度不高,导致系统挖掘出许多用户不感兴趣的和表述冗余的关联 规则。本文正是在上述问题的驱动下,在“概念格”110‘17’18】的基础上提出了一 种交互式关联规则挖掘算法(IMAR)并将其应用到了中学智能评估系统中大增 强了原有系统在关联挖掘子模块中和用户的交互性,使得挖掘出的关联规则更加 符合用户的需求,提高了挖掘效率。 1.2本文的主要工作 原有的中学生智能评估系统中的关联规则挖掘子模块通过采用Apriori算法 实现关联规则的挖掘,在挖掘过程中用户只能提出最小支持度

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档