- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘和数据仓库技术应用与前景研究
摘要:近年来,我国社会正在朝向信息化的方向健 康发展,在此过程中,数据挖掘与数据仓库技术在其中发挥 着重要的作用,并给整个社会带来了巨大的变化,本文首先 介绍了数据挖掘技术与数据仓库技术的概念,然后简述了其 在社会中的应用以及发展前景,以供参考。
关键词:数据挖掘技术;数据仓库技术;应用;发展前 景;分析
中图分类号:TP311. 13文献标识码:A文章编号:
1674-7712 (2013) 12-0000-02
随着决策理论、计算机技术、人工智能、信息技术等各
项先进技术的出现与发展,决策支持系统作为电子数据处理 系统也有了得到了较快的发展。为了满足决策支持系统的发 展需要,数据挖掘与数据仓库技术应运而生。可以说数据仓 库与数据挖掘技术是建立在关系数据库、处理分布式技术以 及网络技术的基础上而不断发展起来的,它能够通过分散的 易购环境来解决数据源,并得到准确可靠的信息。要想解决 信息技术在发展中的问题,就需要拥有大量的、准确可靠的 信息。此时数据挖掘与数据仓库技术就发挥着非常重要的作 用。以下就这两项技术的应用与发展前景进行分析。
数据挖掘技术的概述
(一)数据挖掘技术的含义
所谓数据挖掘及时也就是在数据库中获得最有效的、潜 在有用的、最有价值的以及最后能够被理解的模式的一种过 程,从简单的含义来讲,数据挖掘技术也就是在大量的数据 中获取更加有用的知识。它主要是建立在机器学习、模式识 别等领域上发展起来的,并受到人们的广泛关注与青睐。在 数据挖掘及时当中,数据分析是一项非常重要的技术,其中 最为常见的分析方法有领悟式分析、相关关系分析、聚类分 析等。其中聚类分析是最重要的一种分析方法。数据挖掘技 术主要是为了满足用户的需要,将数据库当中的知识信息按 照某种规律排列并提取出来的一项技术。在数据挖掘与分析 的过程中,采用聚类分析法可以将含有一些主观因素的信息 准确无误的传达给用户,满足用户的需要。
与传统支持查询为主的事务性操作数据库有着本质区 别,具备以下四个特征:(1)面向主题。主题是一个抽象的 概念。基于主题组织的数据,根据领域的逻辑内涵,分为独 立的领域,互不交叉,并形成相应的数据视图,汇总表等, 因此适于联机分析处理(OLAP)。(2)集成化。当数据从面 向应用提取到数据仓库时,由于命名冲突、数据结构转换等 的冲突,需要对原有数据进行抽取、清理、加工,形成一致 的命名、变量度量、编码结构、物理属性等。(3)非违约性。 由于数据仓库中的数据是历史数据,当数据集成到数据仓库 后,不需要更改。仅限于装数据和访问数据;并不存在数据 恢复,数据同步,修复死锁等复杂问题。(4)时变性。出于 决策的需要,数据仓库中的数据需要标明时间参数,并随时 间不断变化,即随着时间变化,不断有新的数据内容添加; 不断导出和删除没用的数据内容;不断地重新综合数据。
(二) 数据挖掘技术的具体步骤
在实际工作中,为了满足用户的需要,我们需要将数据 挖掘技术运用在实际工作中,其主要工作流程为:首先需要 对某一个问题进行定义;其次需要进行数据准备,并对一些 数据进行预处理,了解其范围;再次,需要对数据库采取挖 掘技术,获得需要的信息;最后,对获取的结果进行评估与 解释、从狭义的角度来讲,数据挖掘也可以被定义为数据挖 掘算法,它只是整个过程中的某一个步骤而已。
(三) 数据挖掘技术的应用与发展前景
在实际工作中,数据挖掘技术所涉及到的理论知识有很 多歌方面,其中主要包括模式发现构架、规则发现构架、微 观经济学观点、基本概率和统计理论、基本数据压缩理论以 及基于鬼马数据可理论等。其中模式发现构架也就是在整个 源数据库当中发现只是模式的一个过程;规则发现构架也就 是将去啊觉的信息与目标分为几个方面进行处理,以此来发 现其中所蕴含的规则;基本概率和统计理论也就是将知识在 一个源数据库当中通过概率进行随机分布的一个过程;微观 经济学观点的存在主要是为了优化数据挖掘技术;基本数据 压缩理论也就是需要将其当作压缩数据的一门技术;而基于 归纳数据库理论也就是将数据挖掘技术当中一个对数据库 的归纳方面。
在实际工作中,数据挖掘技术是近年来发展起来的一门 新的技术,企业的快速发展、商业利益的不断强大会对其起 到强烈的推动作用。根据统计,每年都会有新的数据挖掘方 法与模型出现,越来越多的研究者也投入了该方面的研究。 但是在其过程中,也有很多亟需解决的问题,例如数据挖掘 方法的效率问题等。
二、数据仓库技术的概述
(一)数据仓库技术的含义
随着社会的发展以及技术水平的不断提高,数据仓库技 术也得到了飞速的发展。数据仓库技术主要是讲数据库中大 量的数据通过整理分类,并将其贵纳入一个中央仓库当中, 此时中央仓库可以对这些数据进行深入分析,最
文档评论(0)