- 2
- 0
- 约1.08万字
- 约 26页
- 2026-06-23 发布于北京
- 举报
数据挖掘历年题库及分析
一、单项选择题(共10题,每题1分,共10分)
在数据挖掘中,旨在发现数据中不同对象的共性,并将具有相似特征的对象自动聚合到同一组的过程被称为()。
A.分类
B.回归
C.聚类
D.关联分析
答案:C
解析:聚类分析是一种无监督学习方法,其核心目标是根据数据的相似性将数据对象划分成不同的簇,使得同一簇内的对象相似度尽可能高,不同簇间的对象相似度尽可能低。分类是监督学习,需要已知类别标签;回归是预测连续值;关联分析是发现数据项之间的有趣联系。
以下哪种数据预处理技术主要用于处理数据集中属性值范围差异过大的问题?()
A.数据清洗
B.数据集成
C.数据变换
D.数据归约
答案:C
解析:数据变换包括归一化和标准化等方法,旨在将不同量纲或取值范围差异巨大的属性值转换到统一的尺度上,以避免在后续分析(如距离计算)中某些属性因数值大而占据主导地位。数据清洗处理缺失值、噪声等;数据集成合并多个数据源;数据归约旨在减少数据量但保持完整性。
在关联规则挖掘中,用于衡量规则“A→B”的可靠性的指标是()。
A.支持度
B.置信度
C.提升度
D.频繁项集
答案:B
解析:置信度定义为“包含A的事务中也包含B的条件概率”,即P(B|A),它衡量了规则的可信程度。支持度衡量规则在数据集中出现的普遍性;提升度衡量规则中A与B的相关性;频繁项集是满足
您可能关注的文档
- 自动驾驶技术试卷及解析.docx
- 嵌入式系统试卷及分析.docx
- 青少年法制教育计划.docx
- 全科医学题库及详解.docx
- 荣誉权保护范围及案例.docx
- 软件测试题库及详解.docx
- 社区网格化管理实施方案.docx
- 摄影人像拍摄技巧试题及解析.docx
- 生物遗传学试题及解析.docx
- 声乐表演试题及解析.docx
- 基于光量子计算机的电网停电后分区模型及量子比特扩容方法.pdf
- 基于量子纠缠光源的椭圆偏振测量技术研究进展.pdf
- 量子博弈:美国在量子信息科技领域的对华竞争.pdf
- 济南市一次污染传输过程中的光量子雷达联合组网监测.pdf
- 用大学物理知识诠释前沿科技——从光的偏振到量子通信.pdf
- 面向公众的前沿科学可视化传播策略研究——以量子科技领域为例.pdf
- 我国量子产业专利池构建对策研究——基于安徽省“量子高地”分析.pdf
- 颠覆性技术如何突围:量子科技崛起背后的多源流耦合逻辑 (1).pdf
- 基于HHL算法的量子牛顿-拉夫逊法潮流计算.pdf
- 欧洲未来产业布局战略及对我国的启示——基于《量子技术计划:战略路线图》的跨界整合式创新研究.pdf
最近下载
- 2025年中国农业科学技术出版社有限公司数字及传媒出版人员招聘笔试参考题库附带答案详解.pdf
- 2025年天津市专业技术人员公需考试试题-为中国式现代化提供强大动力和制度保障——党的二十届三中全会暨《中共中央关于进一步全面深化改革、推进中国式现代化的决定》总体解读.docx VIP
- 人力制动机制动RAILWAY课件.pptx VIP
- 普拉德-威利综合征干预.ppt
- 2026年龙江银行招聘笔试题库必考题.docx VIP
- 浙江国企招聘考试公共基础知识综合检测试卷.docx VIP
- 房屋市政工程有限空间识别与安全作业指南解读.pptx
- 2026中期展望·宏观篇:上半场的预期差,下半场的破局点.pdf VIP
- (完整)高中英语3500词汇表 .pdf VIP
- 2025年广东省深圳市生地会考试卷及答案 .pdf VIP
原创力文档

文档评论(0)