- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2025年商业经济行业技能考试-数据挖掘工程师笔试考试历年典型考题及考点含含答案
第1卷
一.参考题库(共100题)
1.根据关联分析中所处理的值类型,可以将关联规则分类为()。
A、布尔关联规则和量化关联规则
B、单维关联规则和多维关联规则
C、单层关联规则和多层关联规则
D、简答关联规则和复杂关联规则
2.简述分类模型的评价。
3.列举操作型数据与分析型数据的主要区别。
4.简述决策树的构建。
5.从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。
6.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。
7.粒度是对数据仓库中数据的综合程度高低的一个衡量。粒度越小,细节程度越高,综合程度越低,回答查询的种类()
8.数据的预处理方法有哪些?
9.数据挖掘定义是什么?
10.给定两个向量对象,分别表示为p1(22,1,42,10),p2(20,0,36,8): (a)计算两个对象之间的欧几里得距离 (b)计算两个对象之间的曼哈顿距离 (c)计算两个对象之间的闵可夫斯基距离,用x=3 (d)计算两个对象之间的切比雪夫距离
11.考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。
12.简述特征子集选择的搜索策略。
13.分类知识的发现方法主要有哪些?分类过程通常包括哪两个步骤?
14.在多维关联规则挖掘中,我们搜索的不是频繁项集,而是()
15.一个好的聚类分析方法会产生高质量的聚类,具有两个特征:()和()
16.()都属于分裂的层次聚类算法。
A、二分K均值
B、MST
C、Chameleon
D、组平均
17.贝叶斯信念网络(BBN)有如下哪些特点,()。
A、构造网络费时费力
B、对模型的过分问题非常鲁棒
C、贝叶斯网络不适合处理不完整的数据
D、网络结构确定后,添加变量相当麻烦
18.ID3算法主要存在的缺点是什么?
19.非频繁模式()。
A、其支持度小于阈值
B、都是不让人感兴趣的
C、包含负模式和负相关模式
D、对异常数据项敏感
20.OLAP系统和OLTP系统的主要区别包括()。
A、OLTP系统主要用于管理当前数据,而OLAP系统主要存放的是历史数据
B、在数据的存取上,OLTP系统比OLAP系统有着更多的写操作
C、对OLTP系统上的数据访问量往往比对OLAP系统的数据访问量要大得多
D、OLAP系统中往往存放的是汇总的数据,而OLTP系统中往往存放详细的数据
21.下列哪些是数据变换可能涉及的内容?()
A、数据压缩
B、数据概化
C、维归约
D、规范化
22.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
A、关联规则发现
B、聚类
C、分类
D、自然语言处理
23.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()。
A、2
B、3
C、3.5
D、5
24.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是:()。
A、1比特
B、2.6比特
C、3.2比特
D、3.8比特
25.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()。
A、0.821
B、1.224
C、1.458
D、0.716
26.假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,
您可能关注的文档
- 2025年商业经济行业技能考试-速卖通笔试考试历年典型考题及考点含含答案.docx
- 在全市招商引资工作会议暨招商落地提升行动部署会上的讲话.docx
- 专题党课:加强基层组织建设,推动基层党建高质量发展.docx
- 市卫健局党组副书记在理论学习中心组学习2025年全国两会精神研讨发言材料.docx
- 财政局局长在理论学习中心组会上学习2025年全国两会精神研讨发言材料.docx
- 市商务局党组书记在学习中央八项规定精神理论学习中心组会上研讨发言材料.docx
- 某县委办公室党员干部在2025年度学习教育读书班上关于作风建设的研讨发言材料.docx
- 在全县教育领域群众身边不正之风和腐败问题集中整治调度会上的讲话.docx
- 在专题研究全市财政收入组织工作会议上的讲话.docx
- 市纪委监委开展深入贯彻中央八项规定精神学习教育工作方案.docx
- 市科技局副局长在理论学习中心组学习2025年全国两会精神研讨发言材料.docx
- 在深入贯彻中央八项规定精神学习教育读书班开班式上的讲话1.docx
- 关于开展深入贯彻中央八项规定精神学习教育的工作方案.docx
- 市国资委党委书记学习2025年全国两会精神专题研讨发言材料.docx
- 在2025年作风建设专题“读书班”上的研讨发言材料(八项规定).docx
- 在县政府全体会议暨廉政工作会议上的讲话4.docx
- 关于我市农村电商发展情况的调研报告.docx
- 在某某区安全生产重点工作安排部署会上的讲话.docx
- 市发改局党组书记在理论学习中心组会上学习2025年全国两会精神的研讨发言材料1.docx
- 商务局委员会(商务局)基层党组织“分类指导、争先进位”工作方案.docx
文档评论(0)