数据挖掘入门材料1-数据挖掘导论.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘 第一章 数据挖掘导论 数据挖掘作为一个新兴的多学科交叉应用领域,正在各行各业的决策支持活动 扮演着越来越重要的角色。本书将介绍数据挖掘( )与数据库知识发现 ( )的基本知识,以及从大量有噪声、不完整、 甚至是不一致数据集合中,挖掘出有意义的模式知识所涉及的概念与技术方法。 本章将从数据管理技术演化角度,介绍数据挖掘的由来。以及数据挖掘的作用 和意义。同时还将介绍数据挖掘系统的结构、数据挖掘所获得的知识种类,以及数 据挖掘系统的分类。最后还简要介绍了当前数据挖掘领域尚存在的一些热点问题。 计算机与信息技术经历了半个世纪的发展,给人类社会带来了巨大的变化与影 响。在支配人类社会三大要素(能源、材料和信息)中,信息愈来愈显示出其重要 性和支配力,它将人类社会由工业化时代推向信息化时代。随着人类活动范围的扩 展,生活节奏的加快,以及技术的进步,人们能以更快速更容易更廉价的方式获取 和存储数据,这就使得数据及其信息量以指数方式增长。早在 世纪八十年代,据 粗略估算,全球信息量每隔 个月就增加一倍。而进入九十年代,全世界所拥有的 数据库及其所存储的数据规模增长更快。一个中等规模企业每天要产生 以 上来自各生产经营等多方面的商业数据。美国政府部门的一个典型大数据库每天要 接收约 数据量,在 秒到 分钟时间里,要维持的数据量达到 ,存档 数据达 。在科研方面,以美国宇航局的数据库为例,每天从卫星下载的 数据量就达 之多;而为了研究的需要,这些数据要保存七年之久。九十年 代互联网 ( )的出现与发展,以及随之而来的企业内部 网 ( )和企业 外部 网 ( )以及虚拟私有 网 ( : )的产生和应用, 使整个世界互联形成一个小小的地球村 ,人们可以跨越时空地在 网上交换信息和协 同工作。这样 ,展现在人们面前的已不是局限于本部门,本单位和本行业的庞大数 据库,而是浩瀚无垠的信息海洋。据估计, 年全球数据存贮容量约为二千 , 到 年增加到三百万 ,面对这极度膨胀的数据信息量,人们受到 “信息爆炸”、 “混沌信息空间”( )和 “数据过剩”( )的巨大压 力。 数据挖掘 第一章 数据挖掘导论 然而,人类的各项活动都是基于人类的智慧和知识,即对外部世界的观察和了 解,做 出正确的判断和决策以及采取正确的行动,而数据仅仅是人们用各种工具和 手段观察外部世界所得到的原始材料,它本身没有任何意义。从数据到知识到智慧, 需要经过分析加工处理精炼的过程。如图- 所示,数据是原材料,它只是描述发 生了什么事情,并不能构成决策或行动的可靠基础。通过对数据进行分析找 出其中 关系,赋予数据以某种意义和关联,这就形成所谓信息。信息 虽给出了数据中一些 有一定意义的东西,但它往往和人们需要完成的任务没有直接的联 系,也还不能做 为判断、决策和行动的依据。对信息进行再加工,即进行更深入的归纳分析 ,方能 获得更有用的信息,即知识。而所谓知识,可定义为 “信息块中的一组逻辑联 系, 其关系是通过上下文或过程的贴近度发现的”。从信息中理解其模式,即形成知识。 在大量知识积累基础上,总结出原

文档评论(0)

神话 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5203223011000000

1亿VIP精品文档

相关文档