- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
华北科技学院
课程考查报告
班级:软件B121姓名梁高荣
学号:2
课程名称:数据仓库及数据挖掘
课程性质:专业选修
开设学期:2015-2016学第1学期
考核成绩
任课教师:栾尚敏
201511月20日
目录
\o1-3\h\z\u一.数据仓库436078011\h错误!未指定书签。
1.仓库的概念436078012\h错误!未指定书签。
2.数据仓库的特点436078013\h错误!未指定书签。
3.据仓库的结构436078014\h错误!未指定书签。
1.数据挖掘的概念436078015\h错误!未指定书签。
2.数据挖掘的作用436078016\h错误!未指定书签。
四、数据挖掘的步骤436078017\h错误!未指定书签。
1.信息收集436078018\h错误!未指定书签。
2.数据规约:436078019\h错误!未指定书签。
3.数据清理436078020\h错误!未指定书签。
4.数据变换436078021\h错误!未指定书签。
5.数据挖掘过程436078022\h错误!未指定书签。
6.模式评估436078023\h错误!未指定书签。
7.知识表示436078024\h错误!未指定书签。
五、数据挖掘常的基本技436078025\h错误!未指定书签。
1.统计学436078026\h错误!未指定书签。
2.聚类分析和模式识别436078027\h错误!未指定书签。
3.决策树分类技术436078028\h错误!未指定书签。
4.人工神经网络和遗传基因算法436078029\h错误!未指定书签。
5.规则归纳436078030\h错误!未指定书签。
6.可视化技术436078031\h错误!未指定书签。
六、文本挖掘436078032\h错误!未指定书签。
1.文本挖掘的概念436078033\h错误!未指定书签。
2.文本挖掘方法436078034\h错误!未指定书签。
3.挖掘工具436078035\h错误!未指定书签。
4.应用436078036\h错误!未指定书签。
七、挖掘436078037\h错误!未指定书签。
1.挖掘及信息检索436078038\h错误!未指定书签。
2.挖掘的任务436078039\h错误!未指定书签。
3.文本挖掘方法436078040\h错误!未指定书签。
一.数据仓库
1.仓库的概念
数据仓库()是一个面向主题的()、集成的()、相对稳定的()、反映历史变化()的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。
2.数据仓库的特点
根据数据仓库概念的含义,数据仓库拥有以下四个特点:
????(1)面向主题。操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离。数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常及多个操作型信息系统相关。
????(2)集成的。面向事务处理的操作型数据库通常及某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。
????(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。
????(4)反映历史变化。操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
????企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础的。数据仓库不是静态的概念,只有把信息及时交给需要这些信息的使用者
文档评论(0)