- 1
- 0
- 约6.32千字
- 约 19页
- 2026-03-12 发布于四川
- 举报
2026年考公计算机专业数据挖掘试题(含答案)
单项选择题(每题2分,共40分)
1.以下哪种数据挖掘方法主要用于发现数据中的关联规则?
A.聚类分析
B.关联分析
C.分类分析
D.回归分析
答案:B。关联分析主要用于发现数据中不同项目之间的关联规则,比如在购物篮分析中找出哪些商品经常一起被购买。聚类分析是将数据对象分组;分类分析是将数据对象划分到不同类别;回归分析是建立变量之间的函数关系。
2.数据挖掘中,以下哪种技术可用于处理缺失值?
A.归一化
B.数据平滑
C.插补法
D.离散化
答案:C。插补法是处理缺失值的常用技术,如均值插补、中位数插补等。归一化是将数据按比例缩放;数据平滑用于去除数据中的噪声;离散化是将连续数据转换为离散值。
3.在决策树算法中,信息增益是用于:
A.选择最佳划分属性
B.计算树的深度
C.确定叶节点的类别
D.剪枝操作
答案:A。信息增益衡量了使用某个属性进行划分后数据的纯度提升程度,决策树算法通过比较不同属性的信息增益来选择最佳划分属性。计算树的深度有专门的方法;确定叶节点类别根据划分后的样本多数类;剪枝操作是为了防止过拟合。
4.K均值聚类算法的核心步骤不包括:
A.随机初始化K个聚类中心
B.计算每个样本到聚类中心的距离
C.计算数据的协方差矩阵
D.根据距离将样本分配到最近的聚类中心
答案:C
您可能关注的文档
最近下载
- 临床试验质量管理方案.docx VIP
- 广西壮族自治区环境监测收费标准wwwglpricecn.doc VIP
- 宣贯培训(2026年)《GBT 14711-2013中小型旋转电机通用安全要求》.pptx VIP
- 课件:办公室英语——接电话&打电话.ppt VIP
- DuPont塑胶介绍..ppt VIP
- a320-afm-飞行手册中文版-南航.doc VIP
- 八大安全作业票(新规 )(GB 30871-2022) .pdf VIP
- 煤矿单轨吊轨道内力计算及选型.pdf VIP
- 万泰电子-BPJ系列变频器说明书V1.0_20131226.pdf VIP
- HUAMEI华魅电吹管AC966 92312345用户手册.pdf
原创力文档

文档评论(0)