网站大量收购闲置独家精品文档,联系QQ:2885784924

数据仓库及数据挖掘知识总结.doc

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

华北科技学院

课程考查报告

班级:软件B121姓名梁高荣

学号:2

课程名称:数据仓库及数据挖掘

课程性质:专业选修

开设学期:2015-2016学第1学期

考核成绩

任课教师:栾尚敏

201511月20日

目录

\o1-3\h\z\u一.数据仓库436078011\h错误!未指定书签。

1.仓库的概念436078012\h错误!未指定书签。

2.数据仓库的特点436078013\h错误!未指定书签。

3.据仓库的结构436078014\h错误!未指定书签。

1.数据挖掘的概念436078015\h错误!未指定书签。

2.数据挖掘的作用436078016\h错误!未指定书签。

四、数据挖掘的步骤436078017\h错误!未指定书签。

1.信息收集436078018\h错误!未指定书签。

2.数据规约:436078019\h错误!未指定书签。

3.数据清理436078020\h错误!未指定书签。

4.数据变换436078021\h错误!未指定书签。

5.数据挖掘过程436078022\h错误!未指定书签。

6.模式评估436078023\h错误!未指定书签。

7.知识表示436078024\h错误!未指定书签。

五、数据挖掘常的基本技436078025\h错误!未指定书签。

1.统计学436078026\h错误!未指定书签。

2.聚类分析和模式识别436078027\h错误!未指定书签。

3.决策树分类技术436078028\h错误!未指定书签。

4.人工神经网络和遗传基因算法436078029\h错误!未指定书签。

5.规则归纳436078030\h错误!未指定书签。

6.可视化技术436078031\h错误!未指定书签。

六、文本挖掘436078032\h错误!未指定书签。

1.文本挖掘的概念436078033\h错误!未指定书签。

2.文本挖掘方法436078034\h错误!未指定书签。

3.挖掘工具436078035\h错误!未指定书签。

4.应用436078036\h错误!未指定书签。

七、挖掘436078037\h错误!未指定书签。

1.挖掘及信息检索436078038\h错误!未指定书签。

2.挖掘的任务436078039\h错误!未指定书签。

3.文本挖掘方法436078040\h错误!未指定书签。

一.数据仓库

1.仓库的概念

数据仓库()是一个面向主题的()、集成的()、相对稳定的()、反映历史变化()的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

2.数据仓库的特点

根据数据仓库概念的含义,数据仓库拥有以下四个特点:

????(1)面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离。数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常及多个操作型信息系统相关。

????(2)集成的。面向事务处理的操作型数据库通常及某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

????(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

????(4)反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

????企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础的。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者

文档评论(0)

173****6638 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档