面向对象的通用数据挖掘系统的研究与建造-计算机应用技术专业毕业论文.docxVIP

  • 1
  • 0
  • 约9.03万字
  • 约 92页
  • 2019-05-06 发布于上海
  • 举报

面向对象的通用数据挖掘系统的研究与建造-计算机应用技术专业毕业论文.docx

北万文通人学坷!I㈣’L生#位}仑上X 北万文通人学坷!I㈣’L生#位}仑上 X 477098 摘 要 、\f数据挖掘(DataMining,简称DM)技术足当d口一个相当活跃的研究领 域.屯涉及人工智能、数据库技术、机器学习、神经网络、统计学、模式识 别、高性能计算、数据可视化等众多学科和领域。其目的是从大型数据库、 数据仓库或者其他一些数据载体存储的海量数据厂}1发现有效的、新颖的、有 潜在作用的、可信的、并能最终被人理解的模式。不同于传统的统¨查询方 法,数据挖掘对商业决策提供更深层次的、更复朵的支持。 随着信息时代的到来和计算技术的飞速发展,如何进行有效的数据挖掘 成为信息科学研究领域一个新的课题。目前数据挖掘领域有两个研究重点: 一是商效挖掘算法的研究与丌发,二是集成多种挖掘{方法和算法的通用数据 挖掘系统的建造。关联舰则的挖掘是数据挖掘领城的一个重要研究方I自j,其 同的是发现各种数拥集中项目之间的关联关系摊文着驻对关联挖捌技术进 行了深入研究,包括基本理论和方法,以及挖狮f、维护的算法:从应用f内角 度讨论了数据挖掘系统应该具有的体系结构和基本特扯,研究并丌发了一个 面向对象的通用数据挖掘系统。具体研究内容如I-: 1)沦述了数据挖扣{、荚联规则挖捌、维护的苍本理论、万法棚挺,1i算 法,指出了技术的发展现状、面?瞒的问题以及发展方向。 2)介绍了约束关联舰则的挖掘,分析了约束的种类和基本形式,r托ti 介绍了儿种成熟的算法以及约束关联规则挖掘结果的增量武维护策 略,提出了一种快速有效的增量式维护算法Separate M。 3)对数据仓库的发展背景、体系结缃进行j’描述,介绍了数抛仓J4硼q 礓点应_【_}{一一OI,AP技术,从技术触合f}{J们度讨论r基于数据仓库 和OLAP的数据挖掘技术,讨论了H天机分析处理(OLAM)产,J!的 必要性和旗本方法。简要介绍了基于多维数捌、Z方体的数据挖拓l技 术,讨论了数据挖掘语言的发展.指川了它在数据挖掘技术发展过 程中举足轻重的地位。 4)针刘现有数据挖掘系统普遍存在通用。flc)fC好、发现方法单一的弱点, 我们没汁并实现了一个面向对象的通用数据挖掘系统GenMiner,它 集成了分类、关I联挖掘等多利,数据挖掘办法,实现了基于义本文件、 关系型数据库以及数据仓库的数掘挖掘的主要过程:目标数圳选择、 数据预处理、数据挖掘、结果的解释评们和,U视化展示等×采用本 系统,可以对任何行业的数据进ij实例化挖掘,寻找隐含于数扼中 的有价值的知以,用于决策支持。本文介;“了该系统的体系铺构、 整体Hi架、内部fJt;iilj以及系统各部分的填体J力能,暖点介?“丁系统 北方交通人学顺11lift)£生学位沦卫5) 北方交通人学顺11lift)£生学位沦卫 5) 掘,一种是大规模的文本数据,主要用来测试系统对大规模数据集 的支持程度。另一种是铁路货票收入统计数据,其目的是从具体的 应用方面说明GenMiner的有效性。 6)对数据挖掘以及关联规则挖掘的发展进行了展望,指出了十H关领域 分析处理、 蒜瞪 今后研究工作的重点。 关键词数据挖掘、 项约束、t每称,数据仓库、联机 联机分妃挖掘 北方交通大学坝I倒f宄生学位论芷Abstract 北方交通大学坝I倒f宄生学位论芷 Abstract Nowadays,Data Mining(DM)iS of the most active research relevant to artificial intelligence.database technology.nrachine learning.neuraI networks,statistics,pattern recognition.high—pm‘fornlance computing,data visualization and other subjects areas.Its purpose is to discover identi睁ing valid,hoveJ,potentially tlseful,and ultimately underslandab【e pattm’ns in massive data stored in large databases.data warehouses or other jnlbl’mation repositories.Di疗erent from other traditional statistic and que technology.data mining technology provides more deep level and more sophisticate support for business dec

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档