- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
北森题库测试题及答案
单项选择题(每题2分,共10题)
1.以下哪个是衡量数据离散程度的统计量?()
A.均值
B.中位数
C.标准差
D.众数
答案:C
解析:标准差是方差的平方根,能反映数据相对于均值的离散程度。均值是数据的平均水平,中位数是按顺序排列后处于中间位置的数,众数是出现次数最多的数,它们都不是衡量离散程度的。
2.若事件A和B相互独立,P(A)=0.4,P(B)=0.5,则P(A∪B)等于()
A.0.2
B.0.7
C.0.9
D.1
答案:B
解析:因为A、B相互独立,所以P(A∪B)=P(A)+P(B)-P(A)P(B)=0.4+0.5-0.4×0.5=0.7。
3.线性回归方程主要用于()
A.分类预测
B.数值预测
C.聚类分析
D.关联规则挖掘
答案:B
解析:线性回归方程通过建立自变量和因变量之间的线性关系,用于对数值型数据进行预测。分类预测常用决策树等方法,聚类分析是将数据分组,关联规则挖掘是发现数据间的关联关系。
4.以下哪种抽样方法不属于概率抽样?()
A.简单随机抽样
B.分层抽样
C.方便抽样
D.系统抽样
答案:C
解析:方便抽样是根据方便原则选取样本,不是按照概率原理进行抽样,所以不属于概率抽样。简单随机抽样、分层抽样、系统抽样都是按照一定概率抽取样本的方法。
5.数据可视化中,用于展示数据分布的常见图表是()
A.柱状图
B.折线图
C.饼图
D.直方图
答案:D
解析:直方图能够清晰地展示数据在各个区间的分布情况。柱状图常用于比较数据大小,折线图展示数据变化趋势,饼图展示各部分占比。
6.在假设检验中,显著性水平α表示()
A.原假设为真时接受原假设的概率
B.原假设为真时拒绝原假设的概率
C.备择假设为真时接受原假设的概率
D.备择假设为真时拒绝原假设的概率
答案:B
解析:显著性水平α是在原假设为真的情况下,拒绝原假设的概率,也就是犯第一类错误的概率。
7.以下哪个算法属于无监督学习?()
A.决策树
B.支持向量机
C.K均值聚类
D.逻辑回归
答案:C
解析:K均值聚类是将数据分成不同的簇,不需要事先知道数据的类别标签,属于无监督学习。决策树、支持向量机、逻辑回归都需要有标注数据进行有监督学习。
8.对于正态分布的数据,大约()的数据落在均值加减1个标准差范围内。
A.68%
B.95%
C.99%
D.50%
答案:A
解析:正态分布中,约68%的数据落在均值加减1个标准差范围内,约95%的数据落在均值加减2个标准差范围内,约99%的数据落在均值加减3个标准差范围内。
9.以下哪种数据预处理操作可以用于处理缺失值?()
A.标准化
B.离散化
C.插补
D.降维
答案:C
解析:插补是用合适的值填补缺失值的方法。标准化是对数据进行缩放,离散化是将连续数据转换为离散数据,降维是减少数据的维度,它们都不能直接处理缺失值。
10.相关系数的取值范围是()
A.[-1,1]
B.[0,1]
C.[-1,0]
D.(0,1)
答案:A
解析:相关系数衡量两个变量之间线性关系的强度和方向,取值范围是[-1,1],-1表示完全负相关,1表示完全正相关,0表示无线性相关。
多项选择题(每题2分,共10题)
1.以下哪些属于描述性统计分析的指标?()
A.均值
B.方差
C.相关系数
D.中位数
答案:ABD
解析:均值、方差、中位数都用于描述数据的集中趋势、离散程度等特征,属于描述性统计分析指标。相关系数主要用于衡量变量间线性关系,不属于描述数据自身特征的描述性统计指标。
2.以下哪些是常见的数据可视化图表类型?()
A.柱状图
B.折线图
C.散点图
D.雷达图
答案:ABCD
解析:柱状图用于比较数据大小,折线图展示数据变化趋势,散点图可观察变量间关系,雷达图能展示多个变量的综合情况,它们都是常见的数据可视化图表类型。
3.以下哪些属于机器学习中的分类算法?()
A.决策树
B.朴素贝叶斯
C.K近邻算法
D.线性回归
答案:ABC
解析:决策树、朴素贝叶斯、K近邻算法都用于对数据进行分类。线性回归是用于数值预测的回归算法,不属于分类算法。
4.数据挖掘的主要任务包括()
A.分类
B.聚类
C.关联规则挖掘
D.异常检测
答案:ABCD
解析
原创力文档


文档评论(0)