- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
统计与大数据分析基础知识单选题100道及答案解析
1.统计学中,描述数据集中趋势的统计量不包括()
A.均值
B.中位数
C.众数
D.方差
答案:D
解析:方差是描述数据离散程度的统计量,不是集中趋势的统计量。
2.大数据的特点不包括()
A.数据量大
B.数据类型多样
C.数据价值密度高
D.处理速度快
答案:C
解析:大数据的特点包括数据量大、数据类型多样、处理速度快,但其价值密度通常较低。
3.以下哪种抽样方法不属于概率抽样()
A.简单随机抽样
B.分层抽样
C.整群抽样
D.方便抽样
答案:D
解析:方便抽样是非概率抽样方法。
4.一组数据:10,20,30,40,50,其均值为()
A.25
B.30
C.35
D.40
答案:C
解析:均值=(10+20+30+40+50)÷5=30
5.在数据分布中,四分位数间距反映了()
A.数据的集中趋势
B.数据的离散程度
C.数据的偏态程度
D.数据的峰态程度
答案:B
解析:四分位数间距是上四分位数与下四分位数之差,反映了数据的离散程度。
6.数据可视化的主要目的是()
A.使数据更美观
B.节省存储空间
C.增强数据的理解和分析
D.提高数据处理速度
答案:C
解析:数据可视化有助于更直观地理解和分析数据。
7.大数据处理框架Hadoop的核心组件是()
A.Hive
B.HBase
C.MapReduce
D.Spark
答案:C
解析:MapReduce是Hadoop的核心计算框架。
8.以下哪个不是数据分析的步骤()
A.数据收集
B.数据存储
C.数据清洗
D.数据可视化
答案:B
解析:数据存储一般不属于数据分析的典型步骤。
9.箱线图中,箱子的长度表示()
A.数据的全距
B.数据的四分位数间距
C.数据的均值
D.数据的中位数
答案:B
解析:箱子的长度代表四分位数间距。
10.相关系数的取值范围是()
A.[-1,1]
B.[0,1]
C.(-∞,+∞)
D.[0,+∞)
答案:A
解析:相关系数的取值在-1到1之间。
11.假设检验中,第一类错误是()
A.原假设为真时拒绝原假设
B.原假设为假时接受原假设
C.备择假设为真时拒绝备择假设
D.备择假设为假时接受备择假设
答案:A
解析:第一类错误是拒真错误,即原假设为真时拒绝原假设。
12.以下哪种数据类型在大数据中最常见()
A.结构化数据
B.半结构化数据
C.非结构化数据
D.以上都常见
答案:C
解析:在大数据中,非结构化数据最为常见。
13.数据分析中,用于预测的方法通常不包括()
A.回归分析
B.聚类分析
C.时间序列分析
D.决策树
答案:B
解析:聚类分析主要用于分组,而非预测。
14.正态分布的对称轴是()
A.均值
B.中位数
C.众数
D.以上都是
答案:D
解析:正态分布是对称分布,均值、中位数、众数相等且在对称轴上。
15.方差分析的基本思想是()
A.比较均值
B.比较方差
C.比较标准差
D.比较极差
答案:A
解析:方差分析主要用于比较多个总体的均值是否相等。
16.在大数据存储中,HBase适合存储()
A.结构化数据
B.半结构化数据
C.非结构化数据
D.海量的稀疏数据
答案:D
解析:HBase适合存储海量的稀疏数据。
17.以下哪种图表适合展示数据的比例关系()
A.折线图
B.柱状图
C.饼图
D.箱线图
答案:C
解析:饼图用于展示各部分占总体的比例关系。
18.主成分分析的主要目的是()
A.降维
B.分类
C.预测
D.聚类
答案:A
解析:主成分分析通过将多个变量转化为少数几个综合变量,达到降维的目的。
19.数据挖掘中的关联规则挖掘,常用的算法是()
A.Apriori算法
B.K-Means算法
C.C4.5算法
D.ID3算法
答案:A
解析:Apriori算法是关联规则挖掘中常用的算法。
20.对于偏态分布的数据,以下哪个统计量更具有代表性()
A.均值
B.中位数
C.众数
D.标准差
答案:B
解析:中位数对偏态分布的数据更具代表性。
21.以下哪个不是数据预处理的步骤()
A.数据标准化
B.特征工程
C.模型训练
D.缺失值处理
答案:C
解析:模型训练不属于数据预处理的步骤。
22.大数据的4V特征中,Velocity指的是()
A.数据量大
B.
您可能关注的文档
- 智慧健康养老管理基础知识单选题100道及答案解析.docx
- 柔性电子技术基础知识单选题100道及答案解析.docx
- 船舶智能制造技术基础知识单选题100道及答案解析.docx
- 道路工程智能检测基础知识单选题100道及答案解析.docx
- 现代种业技术基础知识单选题100道及答案解析.docx
- 电梯工程技术基础知识单选题100道及答案解析.docx
- 城市轨道交通工程技术基础知识单选题100道及答案解析.docx
- 光电显示技术基础知识单选题100道及答案解析.docx
- 道路与桥梁工程技术基础知识单选题100道及答案解析.docx
- 材料成型及控制技术基础知识单选题100道及答案解析.docx
- 2024年形势与政策课件3讲合集.docx
- 第4-5讲-混一南北与中华民族大统合-中华民族共同体概论教案合集.docx
- 中华民族共同体概论-专家大讲堂合集.docx
- 中华民族共同体概论教案合集8篇.docx
- 第1-5-9讲-混一南北与中华民族大统合-中华民族共同体概论教案合集.docx
- 2024年形势与政策课6讲合集-1.docx
- 第11-1讲-等混一南北与中华民族大统合-中华民族共同体概论教案合集5篇.docx
- 第14-11-4讲-混一南北与中华民族大统合-中华民族共同体概论教案合集.docx
- 第16-13-14讲-混一南北与中华民族大统合-中华民族共同体概论教案合集.docx
- 劳务分包合同示范文doc36(2024版).docx
文档评论(0)