- 2
- 0
- 约6.38万字
- 约 66页
- 2018-12-22 发布于福建
- 举报
dm2平台的扩展及其在铁路货票据上的挖掘应用分析
优秀毕业论文
精品参考文献资料
中文摘要数据库技术从
中文摘要
数据库技术从20世纪80年代初开始,就得到了广泛的普及和应用。伴随着近 年来数据量的急剧增长,以及数据仓库和Web等新型数据源的同益普及,人们面 临的主要问题不再是缺乏足够可以使用的信息,而是如何将这些海量的数据有效 地利用起来。面对这一挑战,数据挖掘技术应运而生,并在各行各业得到了广泛 应用。而关联规则是数据挖掘中最活跃的研究方向之一。
DM2平台是一款由我们设计并正在开发的数据挖掘平台。目前,DM2平台已 开发了用于实例分类和关联规则挖掘的功能组件,并实现了ID3、Naive Bayes、 FP—Growth、CLOSET等数据挖掘算法。但为了满足不同数据挖掘项目的需求,DM2 还有很多有待于完善和扩展之处:首先,DM2平台与数据库的交互能力还有待增 强;其次,DM2平台所实现的算法还很有限,而算法恰恰是一个数据挖掘系统的 精髓,因此,丰富DM2平台的数据挖掘算法是当务之急;再者,DM2平台还不 具备以界面的方式与用户交互的功能。本文针对这些问题,从丰富算法库以及如 何实现用户界面等方面对DM2平台进行了扩展。
首先,本文丰富了DM2平台的数据挖掘算法,在DM2平台上,实现了经典 的Apriori算法,还针对海量数据提出并实现了一种改进的Apriori算法,该算法采
用线性存储结构与垂直数据结构数据库相结合的方式,从一定程度上解决了经典
Apriori算法的瓶颈问题,改善了DM2平台的性能。 其次,本文进一步加强了DM2数据挖掘平台与数据库的交互能力。实现了规
则集到数据库的存储,使DM2平台能够对规则进行过滤、排序、分组等操作。 最后,本文实现了DM2平台数据挖掘的用户界面。采用基于浏览器的技术和
JSP技术实现用户与DM2平台的动态交互操作,并直观得到挖掘结果。 扩展后的DM2平台具有极强的处理大数据集的能力,优异的与数据库交互的
能力,人性化的可视化数据挖掘界面。 本文以2004年郑州铁路局铁路货票数据记录样本为实验数据,基于扩展后的
DM2平台建立了铁路货票数据挖掘系统,实验结果表明,该系统能够挖掘出确实
有价值的关联规则,系统性能稳定可靠。 论文结束部分,讨论了目前DM2平台研究工作中需要进一步完善的问题,指
出了今后的研究方向。
关键词:DM2平台;货票数据挖掘;Apriori算法;改进的A研。一算法
分类号:TP319
AB
AB STRACT
Database technology has been extensively on the popularization and application from the early 1 980s.In recent years along with the rapid growth of the amount of data and the growing popularity of data warehousing and Web data sources,the main problems that people are facing is not lack of useful information,but how to make effective use of enormous data.Faced with this challenge,data mining technologies
have emerged and have been widely applied in all walks of life.Association Rules
mining is the most active one of directions of research on data mining.
DM2 platform is a data mining platform designed and was developing by US.Now DM2 platform has developed the function components for instances classification and association rules mining,and has implemented a variety of data mining algorithms,such as the ID3,Ngive Bayes,FP—Growth and Closet.In order to meet the demands of the different projects for data mining,there are many parts need to improve and exp
您可能关注的文档
- dc600v列车供电辅助电源统研制与开发-电子与通信工程专业毕业论文.docx
- dc亚群 cd4cd25cd127trg及趋化因子在结核性胸膜炎中的免疫调节作用.docx
- dd3基因前列腺癌生长及侵袭转移作用的研究-外科学(泌尿外)专业毕业论文.docx
- ddos攻击流及其源端网络自适检测算法的研究-通信与信息系统专业毕业论文.docx
- dec1lxrβ在帕森病中的作用.docx
- decorin在抑制增生性瘢中的作用及其机理的分析.docx
- decoy odn靶向性阻断stat3信号通路抑制脑胶质瘤细胞增殖研究.docx
- deep web信息集成关技术的研究-计算机应用技术专业毕业论文.docx
- ddx19a识别prrsv基因组rn并激活nlrp3炎症小体.docx
- dectin1介导的人角上皮细胞对烟曲霉菌的固有免疫反应.docx
- 初中九年级英语Unit 13环境保护主题听说整合教学设计.docx
- 85分式方程及其解法课件人教版数学八年级上册.pptx
- 基于核心素养的博物馆主题说明文写作教学设计与实施——以九年级英语为例.docx
- 53一次函数的意义第课时课件浙教版八年级数学上册.pptx
- 大单元视角下“人民民主政权的巩固”与历史关键能力进阶教学设计——以初中历史中考复习课为例.docx
- 五年级数学下册典型例题解析人教版期末重点攻克.pptx
- 小学四年级信息技术《智启信息时代:查找网上信息的基石》教学设计及反思.docx
- 大疆域·大人口·大战略:中国国家空间认知的初步建构.docx
- 人教版(一年级起点)小学英语四年级上册Revision 1 Lesson 2教学设计.docx
- 大单元结构化复习:旧民主主义革命时期(18401919)的内忧外患与救亡图存.docx
原创力文档

文档评论(0)