- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘
的哪类问题? A
A. 关联规则发现
B. 聚类
C. 分类
D. 自然语言处理
2.以下两种描述分别对应哪两种对分类算法的评价标准?
A
(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b) 描述有多少比例的小偷给警察抓了的标准。
A. Precision, Recall
B. Recall, Precision
C. Precision, ROC
D. Recall, ROC
3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
C
A. 频繁模式挖掘
B. 分类和预测
C. 数据预处理
D. 数据流挖掘
4.当不知道数据所带标签时, 可以使用哪种技术促使带同类标签的数据与带其他标签的数据
相分离? B
A. 分类
B. 聚类
C. 关联分析
D. 隐马尔可夫链
5. 什么是 KDD? A
A. 数据挖掘与知识发现
B. 领域知识发现
C. 文档知识发现
D. 动态知识发现
6.使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务? A
A. 探索性数据分析
B. 建模描述
C. 预测建模
D. 寻找模式和规则
7.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?
B
A. 探索性数据分析
B. 建模描述
C. 预测建模
D. 寻找模式和规则
8.建立一个模型, 通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务? C
A. 根据内容检索
B. 建模描述
C. 预测建模
D. 寻找模式和规则
9.用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?
A. 根据内容检索
B. 建模描述
C. 预测建模
D. 寻找模式和规则
10.下面哪种不属于数据预处理的方法? D
A 变量代换B 离散化
C 聚集
D 估计遗漏值
11.假设 12 个销售价格记录组已经排序如下:
5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用
如下每种方法将它们划分成四个箱。等频(等深)划分时, 15 在第几个箱子内? B
A 第一个B 第二个C 第三个D 第四个
12.上题中,等宽划分时(宽度为
50), 15 又在哪个箱子里?
A
A 第一个B 第二个C 第三个D 第四个
13.下面哪个不属于数据的属性类型:
D
A 标称B 序数C 区间D 相异
14. 在上题中,属于定量的属性类型是:
C
A 标称B 序数C 区间D 相异
15. 只有非零值才重要的二元属性被称作:
C
A 计数属性B 离散属性
C 非对称的二元属性D 对称属性
16. 以下哪种方法不属于特征选择的标准方法:
D
A 嵌入B 过滤C 包装
D 抽样
17.下面不属于创建新属性的相关方法的是:
B
A 特征提取
B 特征修改
C 映射数据到新的空间D 特征构造
18. 考虑值集 {1、 2、 3、 4、5、 90},其截断均值( p=20%)是 C A 2
B 3
C 3.5
D 5
19.下面哪个属于映射数据到新的空间的方法? A
A 傅立叶变换
B 特征加权C 渐进抽样D 维归约
20.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是:
B
A 1 比特
B 2.6 比特C 3.2 比特D 3.8 比特
21.假设属性 income 的最大最小值分别是
12000 元和 98000 元。利用最大最小规范化的方法
将属性的值映射到 0 至 1 的范围内。对属性 income 的 73600 元将被转化为: D
A 0.821 B 1.224 C 1.458 D 0.716
22.假定用于分析的数据包含属性
age。数据元组中 age 的值如下 (按递增序):13,15,16,
16, 19,20,20,21,22,22,25, 25,25,30,33,33,35,35, 36, 40,45,46,52,
70, 问题:使用按箱平均值平滑方法对上述数据进行平滑, 箱的深度为 3。第二个箱子值为:
A
A 18.3 B 22.6 C 26.8 D 27.9
23. 考虑值集 {12 24 33 2 4 55 68 26} ,其四分位数极差是:
A
A 31 B 24 C 55 D 3
24. 一所大学内的各年纪人数分别为:一年级
200 人,二年级 160 人,三年级 130 人,四年
级 110 人。则年级属性的众数是: A
A
您可能关注的文档
- (最新完整版)人教版七年级英语下七单元教案.doc
- (最新完整版)人教版三年级数学下册第七单元测试题.doc
- (最新完整版)人教版三年级下册第二单元《一位数除三位数笔算除法》教学设计.doc
- (最新完整版)人教版三年级下册语文教学进度表.doc
- (最新完整版)人教版三年级下册语文期中考试试卷.doc
- (最新完整版)人教版三年级下学期解决问题专项练习.doc
- (最新完整版)人教版五年级上册语文第一单元导读课.doc
- (最新完整版)人教版五年级数学上册期末复习试卷(含答案).doc
- (最新完整版)人教版五年级数学下册教案-单元教案-第4单元-最小公倍数.doc
- (最新完整版)人教版五年级数学下册期中测试题.doc
- (最新完整版)数据挖掘第三版第六章课后习题答案.doc
- (最新完整版)数据挖掘概念课后习题答案.doc
- (最新完整版)数据与计算机通信+data+and+computer+communication+课后习题答案.doc
- (最新完整版)数列单元测试卷含答案.doc
- (最新完整版)数列全部题型归纳(非常全面,经典).doc
- (最新完整版)数列题型及解题方法归纳总结.doc
- (最新完整版)数列证明题型总结(教师版)附答案.doc
- (最新完整版)数列知识点总结(经典).doc
- (最新完整版)数学:13.4二元一次方程组的图象解法教案(沪科版八年级上).doc
- (最新完整版)数学北师大版五年级下册《分数乘法(三)试一试》.doc
最近下载
- 2023年版知识产权侵权民事答辩状.docx VIP
- TIPTOP实际成本.ppt VIP
- DNS服务器配置与管理dns域名系统详解.pptx VIP
- ERP技术与管理课件:库存管理.ppt VIP
- 2025年上海交通大学校纪校规考试120题答案.pdf VIP
- 欧洲规范-NF P94-061-3-中文.pdf VIP
- 《高等数学(上册)》(阳平华)645-4教案 第四章 第17课 分部积分法、几种特殊类型函数的积.doc VIP
- TIPTOP_ERP基础知识.ppt VIP
- 地理-山西省运城市教育发展联盟2023-2024学年高二上学期10月月考试题和答案.docx VIP
- 《高等数学(上册)》(阳平华)645-4教案 第四章 第15课 不定积分的概念与性质.doc VIP
文档评论(0)