- 0
- 0
- 约7.61千字
- 约 11页
- 2026-01-28 发布于江苏
- 举报
工业大数据分析师考试试卷(总分100分)
一、单项选择题(共10题,每题1分,共10分)
工业大数据的核心特征不包括以下哪项?
A.高价值密度(Value)
B.多源异构(Variety)
C.实时性强(Velocity)
D.低准确性(LowAccuracy)
答案:D
解析:工业大数据的典型5V特征为Volume(海量)、Velocity(高速)、Variety(多样)、Veracity(真实)、Value(价值)。低准确性(LowAccuracy)是对Veracity(真实性)的错误表述,工业场景对数据准确性要求极高,因此D错误。
以下哪项是工业设备数据采集的典型协议?
A.HTTP
B.MQTT
C.TCP/IP
D.SMTP
答案:B
解析:工业设备数据采集常用协议包括MQTT(消息队列遥测传输,适合低带宽场景)、OPCUA(工业标准协议)等。HTTP、TCP/IP是通用网络协议,SMTP是邮件传输协议,均非工业设备专用采集协议,故B正确。
工业时序数据(如设备振动信号)的核心特征是?
A.非结构化
B.时间相关性
C.高维度
D.离散性
答案:B
解析:工业时序数据是按时间顺序记录的连续或离散数据,其核心特征是时间维度的强相关性(如设备状态随时间演变)。非结构化(如文本)、高维度(如传感器阵列)、离散性(如开关信号)是部分场景特征,但非核心,故B正确。
工业大数据清洗中,处理异常值的常用方法不包括?
A.直接删除
B.均值填充
C.插值法(如线性插值)
D.聚类分析识别
答案:B
解析:均值填充通常用于处理缺失值,而非异常值。异常值处理方法包括直接删除(少量异常)、插值法(根据时间序列趋势修正)、聚类分析(通过数据分布识别异常),故B错误。
以下哪项属于工业大数据分析中的“特征工程”步骤?
A.安装传感器
B.计算设备温度的标准差
C.训练随机森林模型
D.生成可视化报表
答案:B
解析:特征工程是从原始数据中提取有价值特征的过程,如计算统计量(标准差、均值)、时间窗口特征(滑动平均)等。安装传感器(数据采集)、训练模型(模型构建)、生成报表(结果展示)均不属于特征工程,故B正确。
工业大数据平台的核心组件不包括?
A.数据存储层(如HBase)
B.计算引擎层(如Spark)
C.应用接口层(如RESTAPI)
D.人力资源管理系统(HRMS)
答案:D
解析:工业大数据平台通常包括数据采集层、存储层(HBase/HDFS)、计算层(Spark/Flink)、分析层(机器学习框架)、应用层(API/可视化)。HRMS是企业管理系统,与大数据平台无关,故D错误。
以下哪种场景最适合使用时序预测模型(如LSTM)?
A.设备故障分类(正常/故障)
B.产品质量缺陷检测(图像识别)
C.未来24小时设备温度预测
D.客户订单区域分布分析
答案:C
解析:LSTM(长短期记忆网络)是时序预测的典型模型,适合预测时间序列的未来值(如设备温度、能耗)。故障分类(分类任务)、缺陷检测(计算机视觉)、区域分布(空间分析)均不依赖时序预测,故C正确。
工业大数据隐私保护的核心原则是?
A.尽可能收集所有设备数据
B.数据脱敏(如匿名化处理)
C.向第三方开放原始数据
D.仅存储最近1天的数据
答案:B
解析:工业大数据涉及设备敏感信息(如工艺参数),隐私保护需遵循最小化收集、脱敏处理(如去除设备唯一标识)、访问控制等原则。收集所有数据(过度采集)、开放原始数据(泄露风险)、仅存1天数据(丢失历史价值)均不符合要求,故B正确。
以下哪项是工业大数据“价值密度低”的典型表现?
A.传感器每秒产生1000条数据
B.90%的设备数据与当前分析目标无关
C.数据存储需要PB级存储空间
D.数据传输需要5G网络支持
答案:B
解析:价值密度低指海量数据中仅有少量与分析目标相关(如设备异常检测中,99%是正常数据)。A(高Velocity)、C(高Volume)、D(高Velocity支持)均描述其他5V特征,故B正确。
工业大数据分析中,“离线分析”与“实时分析”的主要区别是?
A.数据来源不同
B.对计算延迟的要求不同
C.使用的算法不同
D.存储的介质不同
答案:B
解析:离线分析(如每日生产报表)允许分钟级或小时级延迟,实时分析(如设备异常预警)需毫秒级或秒级响应,核心区别是延迟要求。数据来源(如传感器)、算法(如均可用随机森林)、存储介质(如均可用HDFS)无本质差异,故B正确。
二、多项选择题(共10题,每题2分,共20分)(每题至少2个正确选项)
工业大数据的典型来源包括?
A.生产设备传感器(如PLC)
B.ERP系统(企业资源计划)
原创力文档

文档评论(0)