辽宁石油化工大学《数据挖掘与数据分析》2023-2024学年第一学期期末试卷.docVIP

辽宁石油化工大学《数据挖掘与数据分析》2023-2024学年第一学期期末试卷.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

学校________________班级____________姓名____________考场____________准考证号

学校________________班级____________姓名____________考场____________准考证号

…………密…………封…………线…………内…………不…………要…………答…………题…………

第PAGE1页,共NUMPAGES3页

辽宁石油化工大学

《数据挖掘与数据分析》2023-2024学年第一学期期末试卷

题号

总分

得分

批阅人

一、单选题(本大题共20个小题,每小题1分,共20分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、在一项关于城市居民消费习惯的调查中,随机抽取了1000个家庭,记录了他们每月在食品、服装、娱乐等方面的支出。若要分析不同收入水平家庭在消费结构上的差异,以下哪种统计方法最为合适?()

A.描述性统计B.推断统计C.相关分析D.方差分析

2、要检验一个骰子是否均匀,投掷了60次并记录每个点数出现的次数。应使用哪种统计检验方法?()

A.单样本t检验B.单样本方差分析C.卡方拟合优度检验D.独立性检验

3、要比较两个以上总体的均值是否相等,同时考虑多个因素的影响,应该使用哪种方差分析?()

A.单因素方差分析B.双因素方差分析C.多因素方差分析D.协方差分析

4、某工厂生产的零件尺寸存在一定的误差,误差服从正态分布。若要控制零件尺寸在某个范围内的概率,需要用到以下哪个统计量?()

A.标准分数

B.概率密度函数

C.分布函数

D.以上都是

5、已知随机变量X服从参数为λ的泊松分布,且P(X=2)=P(X=3),则λ的值是多少?()

A.2

B.3

C.6

D.9

6、某学校对学生的身高和体重进行了测量,想要了解身高和体重之间的关系是否为线性关系,可以通过绘制以下哪种图形来判断?()

A.散点图

B.折线图

C.直方图

D.箱线图

7、在一个有1000个数据的样本中,计算得到众数为50,均值为60,中位数为55。这组数据的分布可能是怎样的?()

A.左偏态B.右偏态C.正态分布D.均匀分布

8、在一个多元线性回归模型中,如果存在多重共线性问题,会对模型产生什么影响?()

A.系数估计不准确B.模型预测能力下降C.方差增大D.以上都是

9、对于一个分类变量,要检验其不同类别之间的比例是否符合某种预期,应采用哪种检验方法?()

A.t检验

B.方差分析

C.卡方检验

D.F检验

10、为了解某超市不同商品的销售情况,对一周内的销售数据进行分析。哪种统计图表最能直观地展示各类商品的销售额占比?()

A.柱状图B.折线图C.饼图D.箱线图

11、在一项关于居民收入与消费关系的调查中,随机抽取了500个家庭的数据。已知家庭收入的均值为8000元,标准差为1500元。若收入服从正态分布,那么大约有多少家庭的收入在5000元到11000元之间?()

A.95%B.68%C.99.7%D.81.8%

12、在对两个变量进行相关分析时,如果相关系数的绝对值接近1,说明()

A.两个变量线性关系强B.两个变量线性关系弱C.两个变量没有关系D.无法判断

13、在对两个总体均值进行比较时,已知两个总体方差相等。从两个总体中分别抽取样本量为10和15的样本,计算得到两个样本的均值分别为20和25,样本方差分别为4和5。则两个总体均值之差的95%置信区间为()

A.(-7.26,1.26)B.(-6.32,2.32)C.(-5.18,3.18)D.(-4.56,4.56)

14、要研究不同地区、不同性别消费者的消费行为差异,应该采用哪种数据分析方法?()

A.多因素方差分析B.多元线性回归C.对应分析D.以上都可以

15、对于一个时间序列数据,如果存在季节性变动,应采用哪种方法进行预测?()

A.简单移动平均法

B.指数平滑法

C.季节指数法

D.自回归模型

16、某工厂生产的灯泡寿命服从正态分布,平均寿命为1500小时,标准差为200小时。从该工厂生产的灯泡中随机抽取100个,那么这100个灯泡的平均寿命在1450小时到1550小时之间的概率约为()

A.0.6826B.0.9544C.0.9974D.0.3413

17、为

您可能关注的文档

文档评论(0)

182****1805 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档