- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
由数据到知识的信息升华引擎
——数据仓库与数据挖掘技术浅析
张蕾
北京邮电大学
1959年,丹尼尔.贝尔提出“后工业社会”概持管理决策分析的数据集台 数据仓库和从大
念,做出了人类首次对信息社会的猜想。20世纪 量数据中提取或挖掘知识的数据挖掘技术应运而
70年代,阿尔温.托夫勒又以传世之作《第三次浪 生。
潮》把“信息社会”的概念引向全球。1982年,约 自20世纪60年代形成的数据库系统开始算
翰.奈斯比特在《大趋势》中,描述了从工业社会向 起,数据仓库和数据挖掘技术的研究虽然都基本
信息社会过渡的标志和基本特征,“数据”是信息 起于20世纪80年代后期。但数据仓库在20世
生活中不可或缺资源的共识已深人人心。进人 纪90年代就开始流行,过去几年,国外许多公司
2l世纪,信息高速公路及互联网的崛起,形成了 已花费几百万美元,建立了企业数据仓库,仅沃尔
“信息爆炸”的风暴,作为信息载体的“数据”涌流 码(wal.Man)一家的数据仓库容量,到1997年就
不断。人们开始寻求在数据海洋中获取兴趣知识 已达到24兆字节(24TB)。目前进入中国的数据
的更佳出路。于是,数据仓库和数据挖掘技术逐 仓库产品基本分为传统数据库所提供的数据仓库
渐成为计算机科学技术领域中的新亮点。 工具。如SQL(StructuredQuery
cresoft)和为第三方软件高等提供的工具两类。而
l 数据仓库和数据挖掘是信息技术自然
对于数据挖掘来说,直到1989年8月在美国底特
演化的结果
律市召开的第十一届国际联合人工智能学术会上
众所周知,信息是客观世界中各种事物状态 才正式形成数据挖掘的概念。不过,从1995年开
与特征的反映;数据足信息的载体,是描述客观事 始,每年一次的知识发现gOD(Knowledgediscovery
物的数字、图形、音像、字符的符号集合。随着现 indatabase)国际学术大会,却很快就把数据挖掘
代社会的发展,由于科学技术高新化,市场经济开 技术研究迅速推入高潮。当年许多文章都预言数
放化和全球经济一体化浪潮的冲击,当今世界政 据挖掘是一个“正在兴起的市场”。事实上,如今
治格局多极化和经济角逐模式多元化的趋势更加 数据挖掘技术的使用遍及零售业、银行业、证券
扑朔迷离,“知识更新,数据膨胀”令人应接不暇。 业、电信业和众多跨国企业。在我国,随着商务、
特别是互联网络laltemet和内联网络Intrmlet的形科学和行政事务的逐渐计算机化和信息化,国家
成,面对以10亿计算的网页,浩如烟海的数据开 “以信息化带动工业化”的战略实施,使学术界和
始被描述为“富裕的数据,贫穷的信息(RichData, 产业界更加关注数据挖掘技术,许多高校也先后
Poor
Information)”。传统意义上的数据库管理系开设了相关课程,从此,数据挖掘的研究开发方兴
统DBMS(DatabaseManagement 未艾、蓬勃发展起来。
System)已不再胜
任。数据海量成几何级增长;不同类别的数据难
2数据仓库与数据挖掘的特点和关系
以整合,数据访问的响应性不断下降,致使决策支
持系统DSS(Decision 2.1数据仓库的特点
SuppoaSystem)往往无功而
返。 与面向应用的数据库不同,数据仓库是面向
因此,一种面
原创力文档


文档评论(0)