网站大量收购独家精品文档,联系QQ:2885784924

2025年商业经济行业技能考试-数据挖掘工程师考试近5年真题荟萃附答案.docx

2025年商业经济行业技能考试-数据挖掘工程师考试近5年真题荟萃附答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

(图片大小可自由调整)

2025年商业经济行业技能考试-数据挖掘工程师考试近5年真题荟萃附答案

第I卷

一.参考题库(共80题)

1.有关数据仓库的开发特点,不正确的描述是:()。

A、数据仓库开发要从数据出发

B、数据仓库使用的需求在开发出去就要明确

C、数据仓库的开发是一个不断循环的过程,是启发式的开发

D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式

2.简述数据挖掘的过程。

3.非频繁模式()。

A、其支持度小于阈值

B、都是不让人感兴趣的

C、包含负模式和负相关模式

D、对异常数据项敏感

4.数据仓库系统的组成部分包括数据仓库,仓库管理,数据抽取,分析工具等四个部分。

5.下面哪种数据预处理技术可以用来平滑数据,消除数据噪声?()

A、数据清理

B、数据集成

C、数据变换

D、数据归约

6.以下哪些算法是分类算法,()。

A、DBSCAN

B、C4.5

C、K-Mean

D、EM

7.简述数据仓库ETL软件的主要功能和对产生数据的目标要求。

8.已知数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max规范化,将age值35转换到[0.0,1.0]区间。 (b)使用z-score规范化转换age值35,其中,age的标准偏差为12.94年。 (c)使用小数定标规范化转换age值35。

9.()这些数据特性都是对聚类分析具有很强影响的。

A、高维性

B、规模

C、稀疏性

D、噪声和离群点

10.通过聚集多个分类器的预测来提高分类准确率的技术称为()。

A、组合(ensemble)

B、聚集(aggregate)

C、合并(combination)

D、投票(voting)

11.考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。

12.根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是()。

A、关联分析

B、分类和预测

C、演变分析

D、概念描述

13.下面属于维归约常用的线性代数技术的有()。

A、主成分分析

B、特征提取

C、奇异值分解

D、特征加权

E、离散化

14.简述你对数据仓库未来发展趋势的看法。

15.如果规则不满足置信度阈值,则形如的规则一定也不满足置信度阈值,其中是X的子集。

16.数据的噪声是指()。

A、孤立点

B、空缺值

C、测量变量中的随即错误或偏差

D、数据变换引起的错误

17.聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。

18.维度可以根据其变化快慢分为元变化维度、()维度和剧烈变化维度三类。

19.数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成部分()全面地描述出来。

20.数据概化是指:()

21.以下哪些学科和数据挖掘有密切联系?()

A、统计

B、计算机组成原理

C、矿产挖掘

D、人工智能

22.数据处理通常分成两大类:联机事务处理和()

23.寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤?()

A、决定要使用的表示的特征和结构

B、决定如何量化和比较不同表示拟合数据的好坏

C、选择一个算法过程使评分函数最优

D、决定用什么样的数据管理原则以高效地实现算法

24.数据立方体度量可以根据其所使用的聚集函数分

您可能关注的文档

文档评论(0)

道星文化 + 关注
官方认证
内容提供者

专业机构诚挚服务,助您成功,护您远航!

认证主体成都梦创道星文化传播有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510114MACQ3KQGX6

1亿VIP精品文档

相关文档