湖南信息学院《数据分析开放实践》2023-2024学年第一学期期末试卷.docVIP

湖南信息学院《数据分析开放实践》2023-2024学年第一学期期末试卷.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

学校________________班级____________姓名____________考场____________准考证号

学校________________班级____________姓名____________考场____________准考证号

…………密…………封…………线…………内…………不…………要…………答…………题…………

第PAGE1页,共NUMPAGES3页

湖南信息学院《数据分析开放实践》

2023-2024学年第一学期期末试卷

题号

总分

得分

一、单选题(本大题共15个小题,每小题1分,共15分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、某地区的房价数据存在极端值,为了更稳健地描述房价的平均水平,应采用以下哪种统计量?()

A.均值

B.中位数

C.众数

D.几何平均数

2、某工厂生产的一批灯泡,其使用寿命服从正态分布,均值为1500小时,标准差为200小时。从这批灯泡中随机抽取一个,其使用寿命超过1800小时的概率大约是多少?()

A.0.0228B.0.1587C.0.0668D.0.0013

3、在一次关于大学生就业意向的调查中,共发放问卷1000份,回收有效问卷800份。在有效问卷中,有400人表示希望毕业后进入国有企业工作。以95%的置信水平估计大学生中希望毕业后进入国有企业工作的比例的置信区间为()

A.(0.45,0.55)B.(0.47,0.53)C.(0.48,0.52)D.(0.49,0.51)

4、已知两个变量X和Y之间存在线性关系,通过样本数据计算得到相关系数为0.8。若将X和Y的单位都扩大为原来的2倍,新的相关系数将变为多少?()

A.0.8B.1.6C.0.4D.不变

5、为了研究教育程度与收入之间的关系,收集了大量样本数据。绘制散点图后发现,随着教育程度的提高,收入呈现出非线性的增长趋势。此时适合采用哪种回归模型?()

A.线性回归

B.二次多项式回归

C.对数线性回归

D.以上都不合适

6、在一个正态分布中,如果将数据进行标准化变换,那么变换后的数据服从什么分布?()

A.正态分布B.t分布C.标准正态分布D.无法确定

7、在进行多元线性回归分析时,如果某个自变量的t检验不显著,但整个回归方程显著,应该()

A.保留该自变量B.剔除该自变量C.重新收集数据D.无法确定

8、为研究不同年龄段人群对某种新产品的接受程度,随机抽取了三个年龄段的人群进行调查。如果要检验不同年龄段之间的接受程度是否有显著差异,应采用哪种方法?()

A.单因素方差分析

B.双因素方差分析

C.多因素方差分析

D.卡方检验

9、在对两个变量进行相关分析时,得到的相关系数为0,说明这两个变量之间是什么关系?()

A.完全线性相关B.非线性相关C.不相关D.无法确定

10、在研究某地区的经济发展与环境污染的关系时,发现随着经济的增长,环境污染先加重后减轻。这种关系被称为?()

A.正相关B.负相关C.非线性相关D.不相关

11、在进行多元回归分析时,如果某个自变量的方差膨胀因子(VIF)较大,说明存在什么问题?()

A.多重共线性B.异方差C.自相关D.模型不准确

12、已知两个变量X和Y之间的回归方程为Y=3-2X,当X增加1个单位时,Y平均减少多少?()

A.1个单位

B.2个单位

C.3个单位

D.5个单位

13、在进行回归分析时,如果存在多重共线性问题,会对模型产生什么影响?()

A.系数估计不准确B.方差增大C.预测能力下降D.以上都有可能

14、在一项关于城市居民消费习惯的调查中,随机抽取了500个家庭,记录了他们每月在食品、服装、娱乐等方面的支出。以下哪种统计方法最适合用于分析不同收入水平家庭的消费结构差异?()

A.描述统计B.推断统计C.参数估计D.假设检验

15、在一次关于大学生手机使用时间的调查中,发现样本数据的偏态系数为1.5,峰态系数为2.5。这说明数据的分布具有怎样的特征?()

A.右偏且尖峰B.左偏且尖峰C.右偏且平峰D.左偏且平峰

二、简答题(本大题共4个小题,共20分)

1、(本题5分)解释什么是生存分析,并说明其在医学、工程等领域的应用场景。以一个具体的研究问题为例,说明如何进行生存分析以及如何解释结果。

2、(本题5分)论述在进行聚类分析时

您可能关注的文档

文档评论(0)

132****8168 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档