- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年新版关联规则题目及答案
一、单项选择题(每题2分,共10题)
1.以下哪个不是关联规则挖掘中常用的度量指标?
A.支持度
B.置信度
C.准确率
D.提升度
答案:C
2.在关联规则中,“{牛奶}-{面包}”,这表示?
A.购买牛奶的人一定购买面包
B.购买面包的人一定购买牛奶
C.购买牛奶的人可能购买面包
D.牛奶和面包没有关联
答案:C
3.关联规则挖掘的主要目的是发现?
A.数据中的分类关系
B.数据中的频繁项集和关联关系
C.数据中的聚类关系
D.数据中的异常值
答案:B
4.支持度的计算公式是?
A.包含项集的事务数/总事务数
B.包含前件和后件的事务数/包含前件的事务数
C.包含前件和后件的事务数/包含后件的事务数
D.包含后件的事务数/总事务数
答案:A
5.提升度大于1意味着?
A.前件和后件没有关联
B.前件和后件负相关
C.前件和后件正相关
D.无法判断关联关系
答案:C
6.Apriori算法的核心思想是?
A.从大数据集中直接找出频繁项集
B.基于频繁项集的性质进行逐层搜索
C.随机选取项集进行评估
D.利用聚类方法找出频繁项集
答案:B
7.以下哪个是Apriori算法的缺点?
A.计算量小
B.不需要多次扫描数据集
C.产生大量候选项集
D.对大数据集效率高
答案:C
8.关联规则“{尿布}-{啤酒}”的置信度计算方式为?
A.购买尿布和啤酒的人数/购买尿布的人数
B.购买尿布和啤酒的人数/购买啤酒的人数
C.购买尿布的人数/购买啤酒的人数
D.购买啤酒的人数/购买尿布的人数
答案:A
9.在关联规则挖掘中,最小支持度阈值的作用是?
A.控制生成的频繁项集数量
B.确定关联规则的强度
C.计算提升度
D.计算置信度
答案:A
10.FP-growth算法与Apriori算法相比,优势在于?
A.不需要构建候选项集
B.计算量更大
C.对大数据集效率低
D.产生更多中间结果
答案:A
二、多项选择题(每题2分,共10题)
1.以下属于关联规则挖掘应用领域的有?
A.市场营销
B.医疗诊断
C.文本挖掘
D.图像识别
答案:ABC
2.计算关联规则的度量指标有?
A.支持度
B.置信度
C.提升度
D.均方误差
答案:ABC
3.关联规则挖掘中可能面临的问题有?
A.计算复杂度高
B.数据稀疏性
C.规则的有效性评估
D.数据缺失值处理
答案:ABCD
4.以下哪些算法是用于关联规则挖掘的?
A.Apriori算法
B.FP-growth算法
C.K-means算法
D.DBSCAN算法
答案:AB
5.提升度可以反映关联规则的?
A.可靠性
B.实用性
C.全面性
D.稳定性
答案:AB
6.关联规则挖掘过程包括?
A.数据预处理
B.频繁项集生成
C.关联规则生成
D.规则评估
答案:ABCD
7.频繁项集的性质有?
A.频繁项集的所有子集也是频繁项集
B.非频繁项集的超集一定是非频繁项集
C.频繁项集的超集一定是频繁项集
D.非频繁项集的子集一定是非频繁项集
答案:AB
8.数据预处理在关联规则挖掘中的作用有?
A.数据清洗
B.数据转换
C.数据集成
D.数据采样
答案:ABCD
9.关联规则的表示形式可以是?
A.{A}-{B}
B.A?B
C.{A,B}-{C}
D.A,B?C
答案:ABCD
10.在Apriori算法中,剪枝策略的作用是?
A.减少候选项集数量
B.提高算法效率
C.保证频繁项集不被遗漏
D.生成更多关联规则
答案:ABC
三、判断题(每题2分,共10题)
1.支持度越高的关联规则一定越有价值。(×)
2.置信度为1的关联规则表示前件出现时后件必然出现。(√)
3.Apriori算法每次扫描数据集都会生成新的候选项集。(√)
4.提升度小于1说明前件和后件是正相关。(×)
5.FP-growth算法比Apriori算法更适合处理大数据集。(√)
6.关联规则挖掘只能处理数值型数据。(×)
7.最小支持度阈值设置越高,生成的频繁项集可能越少。(√)
8.一个频繁项集的所有子集都一定是频繁项集。(√)
9.关联规则挖掘不需要对数据进行预处理。(×)
10.计算关联规则的置信度不需要考虑支持度。(×)
四、简答题(每题5分,共4题)
1.简述关联规则挖掘的基本概念。
答案:关联规则挖掘旨在
文档评论(0)