- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘试卷题集
数据挖掘复习题集
1.名词解释及简答数据矩阵闭频繁项集,极⼤频繁项集四分位数极差聚类分析
聚类算法DBSCAN中的密度可达与密度相连
简述数据清理的任务
简述k-means聚类与k-中⼼点聚类的相似与不同之处
2.填空题
(1)计算sin(45o)的Matlab命令是(2)假设x=10
,计算
的Matlab命令是
(3)Matlab中清除显⽰内容的命令是(4)Matlab中清除变量y的命令是
(5)Matlab中有矩阵a=[123;456;789],执⾏a(2,:)=[]后,a的值为。(6)Matlab中绘制曲线的基本命令是。
(7)数据质量涉及许多因素,包括,,,时效性,可信性和可解释性。(8)属性的类型由该属性可能具有的值的集合决
定,属性类型包括,,序数
的或数值的。
(9)KDD过程包括:,数据集成,数据选择,数据变换,数据挖掘,模式评估,
和。
(10)⼀个模式是有趣的,如果它是,在某种程度上在新的或测试数据上是有效
的,,新颖的,或验证了⽤户希望证实的某种假设。
(11)数据对象⼜称为样本、、数据点、或。(12)数值属性可以被分为属性和属性(13)常见的数据的可视化技术有
基于的技术,⼏何投影技术,基于的技术以
及层次的和基于图形的技术。
(14)⽀持度和是规则兴趣度的两种度量。
3.选择题:
1)Matlab中,执⾏a=-4:4;b=reshape(a,3,3)后b的值是()。
2)在MATLAB中,列出当前⼯作空间变量名的函数是
(A)who(s)(B)clc(C)path(D)draw
3)已知462837A=??
,则在MATLAB中调⽤命令A(3)的结果为(A)3(B)2(C)⽆结果(D)74)MATLAB对图形窗⼝进⾏灵活分割的命令为
(A)plot(B)subplot(C)aplot(D)ploval5)
[363]A=,[211]B=,则A.
*B=
(A)运算不执⾏,因有错(B)683(C)574(D)663
6)MATLAB中保持图形窗⼝不关闭的命令为
(A)alter(B)holdon(C)holdoff(D)cd7)MATLAB中a=[2,3,1],则b=a.^2的结果为
(A)b=[4,6,1](B)b=[4,9,1](C)b=[4,6,2](D)执⾏出错,⽆结果8)MATLAB中给变量w赋空矩阵的语句为
(A)w=zeros()(B)w=[](C)w=zeros(0,0)(D)clearw
9)某超市研究销售纪录数据后发现,买啤酒的⼈很⼤概率也会购买尿布,这种属于数据挖
掘的哪类问题?()
A.关联规则发现
B.聚类
C.分类
D.⾃然语⾔处理
10)假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使
⽤如下每种⽅法将它们划分成四个箱。等频(等深)划分时,15在第⼏个箱⼦内?()A第⼀个B第⼆个C第三个D第四个11)
上题中,等宽划分时(宽度为50),15⼜在哪个箱⼦⾥?()12)下⾯哪个不属于数据的属性类型:()
A标称
B序数
C区间
D相异
13)在上题中,属于定量的属性类型是:()14)只有⾮零值才重要的⼆元属性被称作:()
A计数属性
B离散属性
C⾮对称的⼆元属性
D对称属性15)以下哪种⽅法不属于特征选择的标准⽅法:()
A嵌⼊
B过滤
C包装
D抽样
16)熵是为消除不确定性所需要获得的信息量,投掷均匀正六⾯体骰⼦的熵是:()
A1⽐特
B2.6⽐特
C3.2⽐特
D3.8⽐特
17)假设属性income的最⼤最⼩值分别是12000元和98000元。利⽤最⼤最⼩规范化的⽅
法将属性的值映射到0⾄1的范围内。对属性income的73600元将被转化为:()A0.821B1.224C1.458D0.716
18)假定⽤于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,
16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使⽤按箱平
均值平
文档评论(0)