- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘试卷一
数据挖掘整理(熊熊整理-----献给梦中的天涯)
单选题
1.下面哪种分类方法是属于神经网络学习算法?( )
A. 判定树归纳
B. 贝叶斯分类
C. 后向传播分类
D. 基于案例的推理
2.置信度(confidence)是衡量兴趣度度量( A )的指标。
A、简洁性
B、确定性
C.、实用性
D、新颖性
3.用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?(A) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B)A 第一个 B 第二个 C 第三个 D 第四个关于OLAP和OLTP的区别描述,不正确的是: (C)A. OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同.B. 与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务.C. OLAP的特点在于事务量大,但事务内容比较简单且重复率高.D. OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( B )
A、层次聚类 B、划分聚类 C、非互斥聚类 D、模糊聚类将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘什么是KDD? (A) A. 数据挖掘与知识发现 B. 领域知识发现 C. 文档知识发现 D. 动态知识发现为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?(B) A. 探索性数据分析 B. 建模描述 C. 预测建模 D. 寻找模式和规则1. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 (对)2. 数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。(对)3. 图挖掘技术在社会网络分析中扮演了重要的角色。(对)4. 模式为对数据集的全局性总结,它对整个测量空间的每一点做出描述;模型则对变量变化空间的一个有限区域做出描述。(错)5. 寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。(错)6. 离群点可以是合法的数据对象或者值。 (对)7. 离散属性总是具有有限个值。 (错)8. 噪声和伪像是数据错误这一相同表述的两种叫法。 (错)9. 用于分类的离散化方法之间的根本区别在于是否使用类信息。 (对)10. 特征提取技术并不依赖于特定的领域。 (错)11. 序列数据没有时间戳。 (对)12. 定量属性可以是整数值或者是连续值。 (对)13. 可视化技术对于分析的数据类型通常不是专用性的。 (错)14. DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。(对)15. OLAP技术侧重于把数据库中的数据进行分析、转换成辅助决策信息,是继数据库技术发展之后迅猛发展起来的一种新技术。 (对)16. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。 (对)17. 数据仓库中间层OLAP服务器只能采用关系型OLAP (错)18.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分. (错)
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息. (错)21. 关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。(错)22. 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数(对)。23. 先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。(错24. 如果规则 不满足置信度阈值,则形如 的规则一定也不满足置信度阈值,其中 是X的子集。(对)25. 具有较高的支持度的项集具有较高的置信度。(错)26. 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数)
您可能关注的文档
- 九年级化学学案第第六单元 碳和碳的氧化物.doc
- 九年级下册人教版历史复习资料2.doc
- 九年级世界历史上册第2课《大河流域》教案(含课后练习).doc
- 习惯性违章行为300条.doc
- 九年级思想品德期末必考非选择题.doc
- 习题七(上)第一册第二章 观察生物.doc
- 二O一三年东营市中考政治试题及答案.doc
- 二年级上册同步阅读.doc
- 二年级心理健康教育教案(下).doc
- 二次函数知识点及对应习题.doc
- 中职班主任工作计划.docx
- 新能源行业2025年广告投放效果评估与渠道协同创新报告.docx
- 2025年新能源绿色建筑认证技术创新与市场应用场景报告.docx
- 2025年储能行业技术创新与储能系统智能化管理商业模式研究报告.docx
- 2025至2030橡胶溶剂行业细分市场及应用领域与趋势展望研究报告.docx
- 2025年光纤传感电缆技术创新报告:光纤传感电缆,引领智能传感技术发展.docx
- 2025年新能源汽车供应链风险管理策略解析报告.docx
- 2025年新能源背景下用户侧储能技术对电力市场交易的创新探索报告.docx
- 2025年丝印二级考试试题及答案.doc
- 安全生产月挑战赛讲解.pptx
原创力文档


文档评论(0)