关联分析考试题及答案.docVIP

关联分析考试题及答案.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

关联分析考试题及答案

一、填空题

1.关联分析中,衡量一个项集在数据集中出现频繁程度的指标是______。

2.关联规则\(X→Y\)的置信度计算公式是______。

3.Apriori算法的核心思想是______。

4.若一个项集的支持度大于等于最小支持度阈值,则称该项集为______。

5.关联分析主要挖掘数据项之间的______关系。

6.FP-growth算法与Apriori算法相比,避免了______。

7.提升度大于1表示项集\(X\)和\(Y\)之间存在______关系。

8.计算支持度和置信度需要统计______和______。

9.关联规则挖掘的两个关键步骤是______和______。

10.序列模式挖掘是关联分析在______数据上的扩展。

二、单项选择题

1.以下哪个不是关联分析的应用场景?()

A.购物篮分析

B.医疗诊断

C.图像识别

D.推荐系统

2.Apriori算法生成候选项集时使用的方法是()

A.连接和剪枝

B.分裂和合并

C.聚类和分类

D.排序和筛选

3.关联规则\(A→B\)的支持度为0.3,置信度为0.6,意味着()

A.30%的交易同时包含\(A\)和\(B\),且包含\(A\)的交易中有60%包含\(B\)

B.60%的交易同时包含\(A\)和\(B\),且包含\(A\)的交易中有30%包含\(B\)

C.30%的交易包含\(A\),60%的交易包含\(B\)

D.60%的交易包含\(A\),30%的交易包含\(B\)

4.最小支持度阈值设置得越高,发现的频繁项集()

A.越多

B.越少

C.不变

D.不确定

5.提升度小于1表示()

A.项集之间正相关

B.项集之间负相关

C.项集之间相互独立

D.无法判断

6.FP-growth算法构建的树结构是()

A.决策树

B.FP树

C.平衡二叉树

D.红黑树

7.关联分析中,项集的元素通常是()

A.连续型数据

B.离散型数据

C.文本数据

D.图像数据

8.以下关于关联规则的说法,正确的是()

A.支持度高的规则一定是有价值的规则

B.置信度高的规则一定是有价值的规则

C.提升度高的规则一定是有价值的规则

D.需要综合考虑支持度、置信度和提升度来评估规则的价值

9.Apriori算法在生成候选项集时,剪枝操作的依据是()

A.最小支持度阈值

B.最小置信度阈值

C.项集的大小

D.项集的顺序

10.序列模式挖掘与关联分析的主要区别在于()

A.序列模式挖掘考虑了数据的顺序

B.关联分析考虑了数据的顺序

C.序列模式挖掘只处理连续型数据

D.关联分析只处理离散型数据

三、多项选择题

1.关联分析的主要指标有()

A.支持度

B.置信度

C.提升度

D.准确率

2.Apriori算法的缺点有()

A.多次扫描数据库

B.产生大量候选项集

C.时间复杂度高

D.空间复杂度高

3.以下属于关联分析应用的有()

A.发现客户购买商品的组合规律

B.预测股票价格走势

C.分析疾病与症状之间的关联

D.推荐用户可能感兴趣的新闻

4.关联规则\(X→Y\)中,若提升度为1,则说明()

A.\(X\)和\(Y\)相互独立

B.知道\(X\)的出现对\(Y\)的出现没有影响

C.\(X\)和\(Y\)正相关

D.\(X\)和\(Y\)负相关

5.FP-growth算法的优点有()

A.只需要扫描数据库两次

B.避免了生成大量候选项集

C.时间复杂度低

D.空间复杂度低

6.确定最小支持度阈值和最小置信度阈值时,需要考虑()

A.数据的规模

B.挖掘的目标

C.数据的分布

D.计算资源

7.关联分析可以处理的数据类型有()

A.购物交易数据

B.医疗记录数据

C.网页浏览记录数据

D.传感器数据

8.以下关于频繁项集的说法,正确的有()

A.频繁项集的所有非空子集也是频繁项集

B.非频繁项集的所有超集都是非频繁项集

C.频繁项集的支持度大于等于最小支持度阈值

D.频繁项集的置信度大于等于最小置信度阈值

9.关联规则挖掘的步骤包括()

A.数据预处理

B.发现频繁项集

C.生成关联规则

D.规则评估

10.序列模式挖掘的应用场景有()

A.客户购买行为的时间序列分析

B.网站访问日志分析

C.生物序列分析

D

文档评论(0)

农村路上走 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档