- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈数据仓库与数据挖掘
浅谈数据仓库与数据挖掘
摘 要:数据仓库与数据挖掘是当今新的技术热点,数据仓库是一种解决数据使用的高效技术,数据挖掘为之提供了更好的决策支持和服务,同时促进了数据仓库技术的发展。数据仓库技术是基于信息系统业务发展的需要,基于数据库系统技术发展而来,并逐步独立的一系列新的应用技术。本文主要从数据仓库与数据挖掘的定义、联系、区别、应用四个方面来进行阐述,数据仓库和数据挖掘二者既相互结合、共同发展,又相互影响、相互促进。数据仓库与数据挖掘越来越广泛地运用到各个领域中,为我们的各方面以及日常生活提供了方便,为科学技术发展作出了巨大贡献。
关键词:数据仓库;数据挖掘;应用
1引言
1996年,数据仓库的概念一出现,立即引起学术界和工业界的极大关注。 厂商们争相展示产品。 研究领域也不甘落后。 掀起了信息领域研究的一股热潮。随着数据仓库技术的迅速发展以及数据仓库管理系统的广泛应用。 人们积累的数据越来越多。 激增的数据背后隐藏着许多重要的信息,人们希望能够对其进行更高层次的分析,以便更好地利用这些数据。 目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据背后隐藏的知识。数据仓库作为一种新型的数据的存储地,为数据挖掘提供了新的支持平台。 数据仓库的发展不仅仅是为数据挖掘开辟了新的空间,更为数据挖掘技术提出了新的要求。
2 数据仓库与数据挖掘定义
数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。数据仓库系统负责从操作型数据库中抽取数据,实现对集成和综合后的数据的管理,并把数据呈现给一组数据仓库前端工具,以满足用户的各种分析和决策的需求。数据仓库系统的前端工具以OLAP工具和数据挖掘工具为代表,是用户赖以从数据仓库中提取、分析数据,以及实施决策的必经途径。数据挖掘DM(Data?Mining),是指从数据中识别出潜在有用的、先前未知的、最终可理解的模式的非平凡过程。研究基于数据仓库的数据挖掘系统结构框架是很有意义的。
数据挖掘是一种大型数据库(如数据仓库)中提取隐藏的预测性信息的新技术。数据挖掘是一种展望和预测性的信息分析工具,它能挖掘数据间潜在的关系模式,发现用户可能忽略的信息,为企业管理者提供前摄的(Proactive)DSS的应用向效益型卖出了重要的一步。传统的DSS通常是在某个假设的前提下通过数据查询和分析来验证或否定这个假设,而数据挖掘技术则能够自动分析数据,进行归纳性推理,从中发掘出潜在模式或产生联想,建立新的业务模型,帮助决策者调整市场策略,做出正确的决策。
3数据挖掘与数据仓库的联系
数据挖掘和数据仓库作为决策支持新技术,在近十年来迅速发展。数据仓库和数据挖掘二者既相互结合、共同发展,又相互影响、相互促进。数据仓库在纵向和横向都为数据挖掘提供了更广阔的活动空间。数据仓库完成数据的收集、集成、存储、管理等工作,数据挖掘面对的是经初步加工的数据,使得数据挖掘能更专注于知识的发现。又由于数据仓库所具有的新特点,对数据挖掘技术提出了更高的要求。另一方面,数据挖掘为数据仓库提供了更好的决策支持,同时促进了数据仓库技术的发展。可以说,数据挖掘和数据仓库技术要充分发挥潜力,就必须结合起来。
4数据仓库与数据库的区别
数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。数据库是面向事务的设计,数据仓库是面向主题设计的;数据库一般存储在线交易数据,数据仓库存储的一般是历史数据;数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计;数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。数据仓库弥补了原有的数据库的缺点,将原来的以单一数据库为中心的数据环境发展为一种新环境:体系化环境。
数据仓库与数据挖掘技术及应用
5数据仓库的应用
在目前竞争激烈的知识经济环境和电子商务经济模式下,重要的信息往往可以决定企业的成败,甚至决定企业的生死存亡。因此,很多行业都采用了数据仓库解决方案充当企业决策机构的智囊和参谋。例如银行ATM系统、证券交易系统、期货交易系统、铁路售票系统、移动通信用户信息管理与服务系统等都是建立在大型数据库基础之上的数据仓库。
证券公司利用客户行为分析系统将所有客户的操作记录进行归类和整理,并结合行情走势,上市公司资料、宏观微观经济数据等、在掌握大量数据的情况下,对客户的行为和市场各因素的关联、客户的操作习惯、盈亏情况、公司的利润分布等进行统计和分析,获得关于客户在本公司的行为、盈亏、习惯等关键信息。从而就有能力为客户提供针对其个人习惯、投资组合的投资建议,从而真正做到对客户的贴心服务。
利用数据仓库的强大功能,银
文档评论(0)