《数据挖掘》复习总结.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数据挖掘》复习一、题型1、 判断题15分2、 单选题15分3、 简单题15分4、 综合题20分5、 计算题35分(C5.0算法、感知机算法、Apriori算法,见练习题)二、考试大纲三、实验/作业评讲在教学过程的各个环节,从学生的出勤、日常表现、作业、测试、项目完成情况及完成质量、TOPCARES能力目标的实现情况等方面,对学生进行全方位的考核。类别考核项目考核主要内容考核方式考核时间所占权重形成性考核出勤出勤、请假、迟到、旷课等过程考核上课期间5%日常表现是否认真听课,回答问题等过程考核上课期间5%作业课堂作业的完成情况过程考核上课期间10%实习项目实践任务的完成情况机考上课期间10%终结性考核完成情况及完成质量教学内容闭卷第17周70%说明:四、知识点梳理,重点教学内容串讲名词解释数据挖掘(P6)、算法(P10)、MODELER中的节点(P13)、MODELER中的数据流(P14)、MODELER中的超节点(P18)、决策树分析(P104)、人工神经网络分析(P157)、关联分析(P207)、知识发现KDD(P6)主要概念 DW产生的基础(P3)DW的基本过程包括(P6)DW能做什么(P7)DW得到的知识形式(P8)DW的算法分类(P10)MODELER的主窗口由哪几部分组成(P13)MODELER中数据流中的节点主要可实现哪些功能(P15)MODELER中数据流的操作主要包括哪几步(P15)MODELER中节点工具箱含由八大选项卡组织(P15)MODELER中通常数据挖掘的基本思路包括哪些过程(P19)MODELER中从数据挖掘角度看变量有哪7大类型(P26),通过TYPE节点可以说明变量什么内容(P42)什么是“有指导学习”(P12、P104)?举例说明;决策树算法的核心问题有哪些(P106)?什么是信息熵(P57、P109)?(信息熵是连续型变量分箱MDLP算法和决策树C5.0算法的核心)人工神经网络中主要有哪些网络种类(P156)神经网络中处理单元的内部结构图(P158)什么是感知机模型(P162)什么是B-P反向传播网络模型,由什么特点(P164)Apriority关联分析算法主要包括哪两大部分技术(P213)(产生频繁集、依据频繁集产生关联规则)决策树分析(P104)、人工神经网络分析(P157)、关联分析(P207)等数据挖掘方法主要用来解决什么问题(分类、预测、关联等)3、算法决策树C5.0算法、人工神经网络B-P感知机算法、关联分析Apriori算法五、典型例题分析(一)判断题,在每题后面正确打勾,错误打叉有高质的原始数据,才可能有高质量的数据挖掘结果。(√ )高质量数据是数据分析的前提和分析结论可靠性的保障。(√ )MODELER中数据质量的探索主要包括数据缺失、数据离群点和极端值等几方面。(√ )数据挖掘的结果都是正确的。( * )MODELER中数据挖掘的数据通常以变量为列、样本为行的二维表形式组织。(√ )变量说明是对读入数据流中变量取值的有效性进行限定、检查和修正,同时指出各个变量在未来建模中的角色。(√ )变量说明应通过Field Ops选项卡中的类型(Type)节点实现。(√ )样本浓缩是通过Record Ops卡中的浓缩(Distinct)节点实现。(√ )样本浓缩是通过Record Ops卡中的汇总(Aggregate)节点实现。(* )数据的重新组织是通过Field Ops选项卡中的类型(Type)节点实现。(* )数据的重新组织是通过Field Ops选项卡中的重构(Restructure)节点实现。(√ )数据质量的探索是通过Output卡中的表(Table)节点实现。(* )数据质量的探索是通过Output卡中的审核(Data Audit)节点实现。(√ )网状图是一种更为生动和直观地展示两个或多个分类变量相关特征的图形。(√ )决策树中,分类树实现对分类型输出变量的分类,回归树则完成对数值型输出变量取值的预测。(√ )决策树中,称树的每个节点都只能生长出两个分枝的树为多叉树。(*)决策树算法中,C5.0用于生成多分支的决策树。(√ )人工神经网络中,神经网络的最低层称为输入层,最顶层称为输出层,中间层称为中间层。(*)在关联分析中,与时间有关的关联分析称为简单关联分析。(*)关联规则中的规则的支持度测度了关联规则的普遍性,表示项目X和项目Y同时出现的概率。(√ )(二)多选题选择题,请在每题正确备选答案前面打勾(单选及多选)。(每题满分3分,全选对得3分,部分选对得2分,有选错者该题不得分)1.Modeler中(类型Type)节点的主要作用有:1)定义变量的取值范围和缺失值;2)变量取值的有效性检查和修正;3)角色说明;4)变量取值的实例化。答案:1-42.Modeler中

您可能关注的文档

文档评论(0)

js1180 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档