数据仓库与数据挖掘-教学大纲.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘》教学大纲 课程概况 课程名称:数据仓库与数据挖掘 英文名称:Data warehousing and data mining 课程性质:选修 课程学时:32 课程学分:2 授课对象:信息类的大学本科高年级学生 开课时间:三年级下学期 讲课方式:课堂+实验 主讲老师: 教学目的 本课程把数据视为基础资源,根据软件工程的思想,总结了数据利用的历程,讲述了数据仓库的基础知识和工具,研究了数据挖掘的任务及其挑战,给出了经典的数据挖掘算法,介绍了数据挖掘的产品,剖析了税务数据挖掘的案例,探索了大数据的管理和应用问题。 教学任务 完成《数据仓库与数据挖掘》教材内容,及教学计划中的互动实践内容,另有学生自主选题的大作业、选作的论文报告。32学时:课堂24、实验2、课外2、研讨4学时。 教学内容的结构 课程由9个教学单元组成,对应于《数据仓库与数据挖掘》的内容。 第1章数据仓库和数据挖掘概述 1.1概述1 1.2数据中心4 1.2.1关系型数据中心 1.2.2非关系型数据中心 1.2.3混合型数据中心(大数据平台) 1.3混合型数据中心参考架构 第2章 数据 2.1数据的概念 2.2数据的内容 2.2.1实时数据与历史数据 2.2.2时态数据与事务数据 2.2.3图形数据与图像数据 2.2.4主题数据与全部数据 2.2.5空间数据 2.2.6序列数据和数据流 2.2.7元数据与数据字典 2.3数据属性及数据集 2.4数据特征的统计描述22 2.4.1集中趋势22 2.4.2离散程度23 2.4.3数据的分布形状25 2.5数据的可视化26 2.6数据相似与相异性的度量29 2.7数据质量32 2.8数据预处理32 2.8.1被污染的数据33 2.8.2数据清理35 2.8.3数据集成36 2.8.4数据变换37 2.8.5数据规约38 第3章 数据仓库与数据ETL基础39 3.1从数据库到数据仓库39 3.2数据仓库的结构39 3.2.1两层体系结构41 3.2.2三层体系结构41 3.2.3组成元素42 3.3数据仓库的数据模型43 3.3.1概念模型43 3.3.2逻辑模型43 3.3.3物理模型46 3.4 ETL46 3.4.1数据抽取47 3.4.2数据转换48 3.4.3数据加载49 3.5 OLAP49 3.5.1维49 3.5.2 OLAP与OLTP49 3.5.3 OLAP的基本操作50 3.6 OLAP的数据模型51 3.6.1 ROLAP52 3.6.2 MOLAP52 3.6.3 HOLAP53 第四章 数据仓库和ETL工具54 4.1 IBM DB2 V10 4.1.1自适应压缩54 4.1.2多温度存储55 4.1.3时间旅行查询56 4.1.4 DB2兼容性功能60 4.1.5工作负载管理61 4.1.6 PureXML62 4.1.7当前已落实63 4.1.8 DB2 PureScale Feature63 4.1.9 分区特性65 4.1.10并行技术67 4.1.11 SQW68 4.1.12 Cubing Services68 4.1.13 列式存储及压缩技术(BLU)70 4.2 InfoSphere Datastage71 4.2.1基于Information Server的架构72 4.2.2企业级实施和管理75 4.2.3高扩展的体系架构79 4.2.4具备线性扩充能力81 4.2.5 ETL元数据管理82 4.3 InfoSphere QualityStage82 第5章 数据挖掘基础84 5.1数据挖掘的起源84 5.2数据挖掘的定义85 5.3数据挖掘的任务86 5.3.1分类 5.3.2回归分析 5.3.3相关分析 5.3.4聚类分析 5.3.5关联规则 5.3.6异常检测 5.4数据挖掘标准流程 5.4.1商业理解 5.4.2数据理解 5.4.3数据准备 5.4.4建立模型 5.4.5模型评估 5.4.6结果部署 5.5数据挖掘的十大挑战性问题 5.5.1数据挖掘统一理论的探索 5.5.2高维数据和高速数据流的研究与应用 5.5.3时序数据的挖掘与降噪 5.5.4从复杂数据中找寻复杂知识 5.5.5网络环境中的数据挖掘 5.5.6分布式数据挖掘 5.5.7生物医学和环境科学数据挖掘 5.5.8数据挖掘过程自动化与可视化 5.5.9信息安全与隐私保护 5.5.10动态、不平衡及成本敏感数据的挖掘 第6章 数据挖掘算法 6.1算法概述 6.1.1分类算法及评估指标 6.1.2聚类算法及其评价指标 6.2 C4.5 6.3 CART算法 6.4 K-Means 算法 6.5 SVM算法121 6.6 Apriori算法 6.7 EM算法 6.8 PageRank 6.

文档评论(0)

132****9295 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档