数据挖掘参考试卷.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
题号 一 二 三 四 总分 得分 得分 评阅人 复核人 一、单选题:(本题满分30分,每小题2分)。 1.(a )是指被测量的变量的随机误差或方差。 A.噪声 B.数据不一致 C.丢失数据 D.冗余 2.事实表包含各维的(a )。 A.码 B.度量 C.属性 D.码和度量 3. 仅有闭单元组成的数据立方体称为(b )。 A.完全立方体 B.闭立方体 C.冰山立方体 D.方体的格 4. 三维数据立方体,包含维month,city,customer_group,度量为price,其中两个单元为a=(Jan,﹡,Business,150),b=(Jan,Toronto,Business,45)。a是b的(a )。 A.父母 B.子女 C.子孙 D.兄弟 5.强关联规则是指满足用户定义的(d )。 A.最小支持度阈值 B.最小置信度阈值 C.最小关联度阈值 D. 最小支持度和最小置信度阈值 6.多谓词关联规则age(X,“20…29”)∧occupation(X,“student”)= buys(X,“laptop”)称为(a )。 A.多维关联规则 B.多层关联规则 C.布尔关联规则 D.维内关联规则 7.多层关联规则,不同抽象层之间可能产生(c )。 A.相等规则 B.冗余规则 C.关联规则 D.度量规则 8.数据仓库的系统结构通常情况下,采用(c ) 结构. A.两层 B.单层 C.三层 D.多层 9.下列操作不属于OLAP操作的是(b )。 A.下钻 B.选择 C. 切片 D.旋转 10.数据泛化通过从相对低的概念层抽象到(a )概念层。 A.较高 B.较低 C.一般 D.不同 11.分类是一种(c )学习。 A.无监督 B.半监督 C.监督 D.均错 12.下列不能用于分类的是(d )。 A.决策树 B.朴素贝叶斯 C.神经网络 D. 信息增益 13. 具有高信息增益的属性,是给定集合中具有(a )的属性。 A.高区分度 B.低区分度 C.无区分度 D.中等区分度 14.朴素贝叶斯分类法是基于( b)的朴素假定。 A.类条件相关 B.类条件独立 C.类条件正相关 D. 类条件负相关 15.聚类准则为(a )。 A.高类内相似度,低类间相似度 B. 高类内相似度,高类间相似度 C. 低类内相似度,高类间相似度 D. 低类内相似度,低类间相似度 得分 评阅人 复核人 二、填空题:(本题满分20分,每空2分)。 1. 数据挖掘简言之就是从大量的数据中提取或挖掘 。 2. 通常,数据仓库用 模型建模,每个维对应于模式中一个或一组 。 3. 数据光滑技术用于去噪,光滑技术包括: 、 和 。 4. 基本方体的单元是 ,非基本方体的单元是 。 5. 频繁项集的所有非空子集也必须是 的。 6. 贝叶斯定理为: 。 得分 评阅人 复核人 三、简答题:(本题满分30分,每小题6分)。 1.简述知识发现的一般过程。3 2.数据预处理都有哪些形式?32 3.简述数据仓库的特征。67 4.请列举出三种相异度距离度量的表达形式。254 5.数据挖掘的应用领域都有哪些? 得分 评阅人 复核人 四、综合题:(本题满分20分,每小题10分)。 1.假定数据仓库P包含三个维:time,doctor,patient;和两个度量:count和charge;其中,count为医生接诊的病人数,charge为医生对病人一次诊治的收费。 其中: time (time_key, day, week, month, quarter, year) doctor (doctor_key, doctor_name, gender, age) patient (patient_key, patient_name, gender, age) 请用星形模式画出其模式图。 2.假定下面的表从面向属性归纳导出。 class birth_place count Programmer USA others 180 120 DBA USA others 20 80 设目标类为Programm

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档