浙江大学远程教育2014年数据挖掘离线作业概要
浙江大学远程教育学院
《数据挖掘》课程作业
姓名: 学 号: 年级: 学习中心: —————————————————————————————
引言
一、填空题
(1)数据库中的知识挖掘(KDD)包括以下七个步骤: 数据清理 、 数据集成 、
数据选择 、 数据变换 、 数据挖掘 、 模式评估 和 知识表示
(2) 数据挖掘的性能问题主要包括: 算法的效率 、 可扩展性 和 并行处理
(3) 当前的数据挖掘研究中,最主要的三个研究方向是: 统计学 、 数据库技术 和
机器学习
(4) 孤立点是指: 一些与数据的一般行为或模型不一致的孤立数据
二、简答题
(1)什么是数据挖掘?
答:数据挖掘指的是从大量的数据中挖掘出那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识。
一个典型的数据挖掘系统应该包括哪些组成部分?
答:一个典型的数据挖掘系统应该包括以下部分: 数据库、数据仓库或其他信息库 数据库或数据仓库服务器 知识库 数据挖掘引擎 模式评估模块 图形用户界面
Web挖掘包括哪些步骤?
答:数据清理: (这个可能要占全过程60%的工作量)
数据集成
将数据存入数据仓库
建立数据立方体
选择用来进行数据挖掘的数据
数据挖掘(选择适当的算法来找到感兴趣的模式)
展现挖掘结果
将模式或者知识应
您可能关注的文档
- 测量误差视频概要.ppt
- 济业2014-47天宝及徕卡电子水准仪数据预处理程序概要.doc
- 济业2014-45纵横断面测量数据处理软件概要.doc
- 济业2014-70高程点拟合断面及断面转换高程点软件概要.doc
- 济南孕妇课堂听课笔记:市妇幼、千佛山、省立、456、交通医院听课笔记概要.doc
- 测量误差及测量结果处理概要.ppt
- 济南版七年级下册(新)第三单元第五章第二节神经调节的结构基础课件(共24张PPT)(共24张PPT)概要.ppt
- 济南版七下第三单元第三章第一节物质运输的载体(共32张PPT)概要.ppt
- 济南版4.1.2传粉和受精概要.ppt
- 济南版七年级下册生物第五章人体生命活动的调节第5节《神经系统的卫生保健》参考课件(共14张PPT)概要.ppt
- 浙江海洋学院船舶静水力性能及稳性计算概要.doc
- 浙江温岭8岁男孩患罕见鱼鳞癣被称鱼男孩[原创]概要.ppt
- 浙江省2009年高等职业技术教育招生考试语文试卷及答案概要.doc
- 浙江省11市2015年中考数学试题分类解析汇编(专题1:实数问题)概要.doc
- 济南版第三单元第三章第三节物质运输的途径概要.ppt
- 浙江省11市2015年中考数学试题分类解析汇编专题3:方程(组)问题概要.doc
- 浙江省2015届高三第二次五校联考语文试题概要.doc
- 浙江省2015届高三生物第一次联考试卷概要.doc
- 浙江省2015中考科学基础复习第1课各种各样的生物课件概要.ppt
- 浙江省2016届高三下学期六校联考考试文综试卷Word版含答案概要.doc
最近下载
- JJF(浙) 1215-2025 水泥安定性试验用沸煮箱校准规范.pdf VIP
- JJF(浙) 1211-2025 大气颗粒物水溶性离子成分在线分析仪校准规范.pdf VIP
- JJF(浙) 1209-2025 电子吊秤校准规范(载荷测量仪法).pdf VIP
- 盐碱化草地生态修复技术规范DB61T 2081-2025.docx VIP
- DB37∕T 5328-2025 城市建设项目停车位配建标准.pdf VIP
- 2025山东省高中生物学业水平考试知识清单.pdf VIP
- Lenze伦茨伺服驱动器i700 cabinet手册.pdf
- 中医师岗位胜任力第二阶梯考核考官培训考核附有答案.docx VIP
- 上海市初中生物会考知识点总复习.pdf VIP
- Higg一整套程序文件.doc
原创力文档

文档评论(0)