（数据分析）关联规则挖掘试题及答案.docVIP

下载本文档

0
0
约2.25千字
约 6页
2026-01-09 发布于广东
举报
版权申诉

（数据分析）关联规则挖掘试题及答案.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2025年（数据分析）关联规则挖掘试题及答案

第I卷（选择题）

答题要求：请将正确答案的序号填在括号内。每题只有一个正确答案。

1.以下哪个不是关联规则挖掘的经典算法？（）

A.Apriori算法B.FP-growth算法C.K-means算法D.频繁项集挖掘算法

答案：C

2.关联规则中，支持度的计算公式是（）。

A.支持该规则的事务数/总事务数

B.支持前件的事务数/支持后件的事务数

C.支持该规则的事务数/支持前件的事务数

D.支持后件的事务数/总事务数

答案：A

3.最小支持度的作用是（）。

A.控制频繁项集的数量

B.控制规则的数量

C.提高挖掘效率

D.以上都是

答案：D

4.关联规则挖掘中，置信度表示（）。

A.规则成立的可能性

B.前件出现时后件出现的概率

C.支持度与最小支持度的比值

D.后件出现的概率

答案：B

5.若有规则A→B，支持度为0.3，置信度为0.8，则表示（）。

A.有30%的事务同时包含A和B，且在包含A的事务中有80%也包含B

B.有80%的事务同时包含A和B，且在包含A的事务中有30%也包含B

C.有30%的事务包含A，80%的事务包含B

D.有80%的事务包含A，30%的事务包含B

答案：A

6.以下关于频繁项集的说法正确的是（）。

A.频繁项集的支持度大于等于最小支持度

B.频繁项集一定是最大频繁项集

C.最大频繁项集一定是频繁项集

D.A和C

答案：D

7.FP-growth算法相比Apriori算法的优势在于（）。

A.不需要产生候选集

B.挖掘速度更快

C.适用于大数据集

D.以上都是

答案：D

8.关联规则挖掘中，提升度的计算公式是（）。

A.置信度/支持度

B.支持度/置信度

C.支持度/（支持前件的事务数支持后件的事务数/总事务数）

D.置信度/（支持前件的事务数支持后件的事务数/总事务数）

答案：C

9.提升度大于1表示（）。

A.规则A→B是强关联规则

B.A和B之间存在正相关关系

C.A和B之间存在负相关关系

D.规则A→B的置信度大于支持度

答案：B

10.在关联规则挖掘中，以下哪种数据类型不适合直接进行关联规则挖掘？（）

A.数值型数据

B.布尔型数据

C.枚举型数据

D.文本型数据

答案：A

第Ⅱ卷（非选择题）

（三）简答题（每题5分）

1.请简述关联规则挖掘的基本步骤。

u关联规则挖掘的基本步骤包括：数据预处理，将原始数据进行清洗、转换等操作；计算频繁项集，通过设定最小支持度，找出所有满足条件的频繁项集；生成关联规则，根据频繁项集，计算置信度等指标，生成关联规则；评估与筛选，对生成的规则进行评估，筛选出有价值的规则。/u

2.什么是支持度、置信度和提升度？它们在关联规则挖掘中有什么作用？

u支持度是指支持该规则的事务数与总事务数的比值，用于衡量规则在数据集中出现的频繁程度。置信度是前件出现时后件出现的概率，反映规则的可靠性。提升度用于衡量A和B之间的相关性，大于1表示正相关。支持度用于筛选频繁项集，置信度用于评估规则强度，提升度帮助判断规则是否有实际价值。/u

3.比较Apriori算法和FP-growth算法的优缺点。

uApriori算法优点是原理简单易懂，缺点是需要产生大量候选集，效率较低。FP-growth算法优点是不需要产生候选集，挖掘速度快，适用于大数据集，缺点是构建FP树需要较多内存。/u

4.如何在关联规则挖掘中处理连续型数据？

u对于连续型数据，可以先进行离散化处理，将其转换为离散型数据。常见的离散化方法有区间划分、基于聚类的离散化等。然后再对离散化后的数据进行关联规则挖掘。/u

（五）讨论题（每题5分）

1.关联规则挖掘在实际应用中有哪些局限性？

u关联规则挖掘存在一些局限性。例如，它只能发现数据中的表面关联，难以发现深层次的因果关系；对于复杂的数据结构和语义关系处理能力有限；挖掘结果可能受到数据噪声的影响；并且在处理大数据时，计算复杂度较高，效率可能成为问题。/u

2.在电商领域，如何利用关联规则挖掘来提高销售业绩？

u在电商领域，可以通过关联规则挖掘分析顾客购买行为。找出经常一起购买的商品组合，将这些商品进行关联推荐。例如，发现购买手机的顾客常买手机壳，就可以在手机页面推荐手机壳。还可以根据不同时间段、不同顾客群体的购买关联模式，调整商品陈列和促销策略，从而提高销售业绩。/u

3.如何评估关联规则挖掘结果的质量？

u可以从多个方面评估关联规则挖掘结果的质量。支持度反映规则的频繁程度，支持度高的规则更有价值。置信度体现规则的可靠性，置信度高的规则更可信。提升

您可能关注的文档

文档评论（0）

标书、施工组织设计、方案编写 + 关注: 实名认证

服务提供商

监理工程师持证人

专注施工方案、施工组织设计编写，有实际的施工现场经验，并从事编制施工组织设计多年，有丰富的标书制作经验，主要为水利、市政、房建、园林绿化。

咨询作者（35人已咨询）服务中

领域认证该用户于2023年05月24日上传了监理工程师

1亿VIP精品文档

更多 >

（数据分析）关联规则挖掘试题及答案.docVIP