数据挖掘和数据仓库技术应用与前景研究.doc

数据挖掘和数据仓库技术应用与前景研究.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘和数据仓库技术应用与前景研究

数据挖掘和数据仓库技术应用与前景研究   摘 要:近年来,我国社会正在朝向信息化的方向健康发展,在此过程中,数据挖掘与数据仓库技术在其中发挥着重要的作用,并给整个社会带来了巨大的变化,本文首先介绍了数据挖掘技术与数据仓库技术的概念,然后简述了其在社会中的应用以及发展前景,以供参考。 关键词:数据挖掘技术;数据仓库技术;应用;发展前景;分析 中图分类号:TP311.13 文献标识码:A 文章编号:1674-7712 (2013) 12-0000-02 随着决策理论、计算机技术、人工智能、信息技术等各项先进技术的出现与发展,决策支持系统作为电子数据处理系统也有了得到了较快的发展。为了满足决策支持系统的发展需要,数据挖掘与数据仓库技术应运而生。可以说数据仓库与数据挖掘技术是建立在关系数据库、处理分布式技术以及网络技术的基础上而不断发展起来的,它能够通过分散的易购环境来解决数据源,并得到准确可靠的信息。要想解决信息技术在发展中的问题,就需要拥有大量的、准确可靠的信息。此时数据挖掘与数据仓库技术就发挥着非常重要的作用。以下就这两项技术的应用与发展前景进行分析。 一、 数据挖掘技术的概述 (一)数据挖掘技术的含义 所谓数据挖掘及时也就是在数据库中获得最有效的、潜在有用的、最有价值的以及最后能够被理解的模式的一种过程,从简单的含义来讲,数据挖掘技术也就是在大量的数据中获取更加有用的知识。它主要是建立在机器学习、模式识别等领域上发展起来的,并受到人们的广泛关注与青睐。在数据挖掘及时当中,数据分析是一项非常重要的技术,其中最为常见的分析方法有领悟式分析、相关关系分析、聚类分析等。其中聚类分析是最重要的一种分析方法。数据挖掘技术主要是为了满足用户的需要,将数据库当中的知识信息按照某种规律排列并提取出来的一项技术。在数据挖掘与分析的过程中,采用聚类分析法可以将含有一些主观因素的信息准确无误的传达给用户,满足用户的需要。 与传统支持查询为主的事务性操作数据库有着本质区别,具备以下四个特征:(1)面向主题。主题是一个抽象的概念。基于主题组织的数据,根据领域的逻辑内涵,分为独立的领域,互不交叉,并形成相应的数据视图,汇总表等,因此适于联机分析处理(OLAP)。(2)集成化。当数据从面向应用提取到数据仓库时,由于命名冲突、数据结构转换等的冲突,需要对原有数据进行抽取、清理、加工,形成一致的命名、变量度量、编码结构、物理属性等。(3)非违约性。由于数据仓库中的数据是历史数据,当数据集成到数据仓库后,不需要更改。仅限于装数据和访问数据;并不存在数据恢复,数据同步,修复死锁等复杂问题。(4)时变性。出于决策的需要,数据仓库中的数据需要标明时间参数,并随时间不断变化,即随着时间变化,不断有新的数据内容添加;不断导出和删除没用的数据内容;不断地重新综合数据。 (二)数据挖掘技术的具体步骤 在实际工作中,为了满足用户的需要,我们需要将数据挖掘技术运用在实际工作中,其主要工作流程为:首先需要对某一个问题进行定义;其次需要进行数据准备,并对一些数据进行预处理,了解其范围;再次,需要对数据库采取挖掘技术,获得需要的信息;最后,对获取的结果进行评估与解释、从狭义的角度来讲,数据挖掘也可以被定义为数据挖掘算法,它只是整个过程中的某一个步骤而已。 (三)数据挖掘技术的应用与发展前景 在实际工作中,数据挖掘技术所涉及到的理论知识有很多歌方面,其中主要包括模式发现构架、规则发现构架、微观经济学观点、基本概率和统计理论、基本数据压缩理论以及基于鬼马数据可理论等。其中模式发现构架也就是在整个源数据库当中发现只是模式的一个过程;规则发现构架也就是将去啊觉的信息与目标分为几个方面进行处理,以此来发现其中所蕴含的规则;基本概率和统计理论也就是将知识在一个源数据库当中通过概率进行随机分布的一个过程;微观经济学观点的存在主要是为了优化数据挖掘技术;基本数据压缩理论也就是需要将其当作压缩数据的一门技术;而基于归纳数据库理论也就是将数据挖掘技术当中一个对数据库的归纳方面。 在实际工作中,数据挖掘技术是近年来发展起来的一门新的技术,企业的快速发展、商业利益的不断强大会对其起到强烈的推动作用。根据统计,每年都会有新的数据挖掘方法与模型出现,越来越多的研究者也投入了该方面的研究。但是在其过程中,也有很多亟需解决的问题,例如数据挖掘方法的效率问题等。 二、 数据仓库技术的概述 (一)数据仓库技术的含义 随着社会的发展以及技术水平的不断提高,数据仓库技术也得到了飞速的发展。数据仓库技术主要是讲数据库中大量的数据通过整理分类,并将其贵纳入一个中央仓库当中,此时中央仓库可以对这些数据进行深入分析,最后满足用户的需要,以此支持管

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档