dm2平台的扩展及其在铁路货票据上的挖掘应用分析.docxVIP

  • 2
  • 0
  • 约6.38万字
  • 约 66页
  • 2018-12-22 发布于福建
  • 举报

dm2平台的扩展及其在铁路货票据上的挖掘应用分析.docx

dm2平台的扩展及其在铁路货票据上的挖掘应用分析

优秀毕业论文 精品参考文献资料 中文摘要数据库技术从 中文摘要 数据库技术从20世纪80年代初开始,就得到了广泛的普及和应用。伴随着近 年来数据量的急剧增长,以及数据仓库和Web等新型数据源的同益普及,人们面 临的主要问题不再是缺乏足够可以使用的信息,而是如何将这些海量的数据有效 地利用起来。面对这一挑战,数据挖掘技术应运而生,并在各行各业得到了广泛 应用。而关联规则是数据挖掘中最活跃的研究方向之一。 DM2平台是一款由我们设计并正在开发的数据挖掘平台。目前,DM2平台已 开发了用于实例分类和关联规则挖掘的功能组件,并实现了ID3、Naive Bayes、 FP—Growth、CLOSET等数据挖掘算法。但为了满足不同数据挖掘项目的需求,DM2 还有很多有待于完善和扩展之处:首先,DM2平台与数据库的交互能力还有待增 强;其次,DM2平台所实现的算法还很有限,而算法恰恰是一个数据挖掘系统的 精髓,因此,丰富DM2平台的数据挖掘算法是当务之急;再者,DM2平台还不 具备以界面的方式与用户交互的功能。本文针对这些问题,从丰富算法库以及如 何实现用户界面等方面对DM2平台进行了扩展。 首先,本文丰富了DM2平台的数据挖掘算法,在DM2平台上,实现了经典 的Apriori算法,还针对海量数据提出并实现了一种改进的Apriori算法,该算法采 用线性存储结构与垂直数据结构数据库相结合的方式,从一定程度上解决了经典 Apriori算法的瓶颈问题,改善了DM2平台的性能。 其次,本文进一步加强了DM2数据挖掘平台与数据库的交互能力。实现了规 则集到数据库的存储,使DM2平台能够对规则进行过滤、排序、分组等操作。 最后,本文实现了DM2平台数据挖掘的用户界面。采用基于浏览器的技术和 JSP技术实现用户与DM2平台的动态交互操作,并直观得到挖掘结果。 扩展后的DM2平台具有极强的处理大数据集的能力,优异的与数据库交互的 能力,人性化的可视化数据挖掘界面。 本文以2004年郑州铁路局铁路货票数据记录样本为实验数据,基于扩展后的 DM2平台建立了铁路货票数据挖掘系统,实验结果表明,该系统能够挖掘出确实 有价值的关联规则,系统性能稳定可靠。 论文结束部分,讨论了目前DM2平台研究工作中需要进一步完善的问题,指 出了今后的研究方向。 关键词:DM2平台;货票数据挖掘;Apriori算法;改进的A研。一算法 分类号:TP319 AB AB STRACT Database technology has been extensively on the popularization and application from the early 1 980s.In recent years along with the rapid growth of the amount of data and the growing popularity of data warehousing and Web data sources,the main problems that people are facing is not lack of useful information,but how to make effective use of enormous data.Faced with this challenge,data mining technologies have emerged and have been widely applied in all walks of life.Association Rules mining is the most active one of directions of research on data mining. DM2 platform is a data mining platform designed and was developing by US.Now DM2 platform has developed the function components for instances classification and association rules mining,and has implemented a variety of data mining algorithms,such as the ID3,Ngive Bayes,FP—Growth and Closet.In order to meet the demands of the different projects for data mining,there are many parts need to improve and exp

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档