湖南应用技术学院《社会统计与R语言B》2023-2024学年第二学期期末试卷.docVIP

湖南应用技术学院《社会统计与R语言B》2023-2024学年第二学期期末试卷.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

自觉遵守考场纪律如考试作弊此答卷无效密

自觉遵守考场纪律如考试作弊此答卷无效

线

第PAGE1页,共NUMPAGES3页

湖南应用技术学院

《社会统计与R语言B》2023-2024学年第二学期期末试卷

院(系)_______班级_______学号_______姓名_______

题号

总分

得分

批阅人

一、单选题(本大题共15个小题,每小题2分,共30分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、为研究广告投入与销售额之间的关系,收集了多个企业的相关数据。如果两者之间存在非线性关系,以下哪种方法可能更适合进行分析?()

A.多项式回归B.逻辑回归C.逐步回归D.岭回归

2、在一项关于不同品牌手机用户满意度的调查中,共收集了1000份有效问卷。其中品牌A的用户有300人,平均满意度为80分;品牌B的用户有500人,平均满意度为75分;品牌C的用户有200人,平均满意度为85分。计算这三个品牌用户的总体平均满意度约为多少?()

A.78分B.79分C.80分D.81分

3、在进行假设检验时,如果得到的检验统计量的值落在拒绝域内,说明什么?()

A.原假设成立B.备择假设成立C.无法判断D.检验有误

4、为了评估一个分类模型的性能,除了准确率外,还可以使用以下哪个指标?()

A.召回率

B.F1值

C.混淆矩阵

D.以上都是

5、对于一个大型数据集,为了快速了解数据的基本特征,以下哪种统计图形最为合适?()

A.直方图

B.散点图

C.箱线图

D.折线图

6、已知某时间序列具有明显的季节性变动,现采用移动平均法进行预测。如果移动平均的项数选择不当,可能会导致()

A.预测值偏高B.预测值偏低C.消除季节性变动D.不能消除季节性变动

7、已知某时间序列的自相关函数在滞后1期的值为0.8,滞后2期的值为0.5。这说明该时间序列具有什么特征?()

A.短期相关性强B.长期相关性强C.无相关性D.无法确定

8、在一组数据中,计算得到第一四分位数为20,第三四分位数为40。那么四分位距是多少?()

A.20B.40C.60D.无法计算

9、在一项关于居民收入与消费关系的调查中,随机抽取了500个家庭的数据。已知家庭收入的均值为8000元,标准差为1500元。若收入服从正态分布,那么大约有多少家庭的收入在5000元到11000元之间?()

A.95%B.68%C.99.7%D.81.8%

10、某城市的气温在一年中呈现季节性变化,为了预测未来几个月的气温,建立了时间序列模型。在模型评估时,以下哪个指标更能反映模型的预测精度?()

A.均方误差

B.决定系数

C.调整后的决定系数

D.残差平方和

11、某超市记录了每天不同时间段的顾客流量,为分析顾客流量的时间分布规律,应选用以下哪种图形?()

A.折线图

B.柱状图

C.饼图

D.箱线图

12、某公司有三个部门,部门A有20名员工,平均工资为8000元;部门B有30名员工,平均工资为7000元;部门C有50名员工,平均工资为6000元。计算该公司员工的平均工资约为()

A.6667元B.6857元C.7000元D.7200元

13、在一项关于城市居民消费水平的调查中,随机抽取了500个家庭,记录了他们每月的消费支出。若要估计该城市所有家庭平均每月消费支出的95%置信区间,以下哪种抽样方法更合适?()

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样

14、为研究气温与空调销量的关系,收集了多年的数据。如果气温与空调销量之间存在非线性关系,应该如何处理?()

A.对气温进行变换B.对销量进行变换C.使用非线性模型D.以上都可以

15、在对两个总体的均值进行比较时,如果两个总体的方差未知但相等,应采用哪种t检验?()

A.独立样本t检验B.配对样本t检验C.方差齐性t检验D.方差不齐t检验

二、简答题(本大题共3个小题,共15分)

1、(本题5分)阐述层次聚类算法的基本思想和步骤,与K均值聚类算法相比,其特点是什么?以一个实际的数据集为例,说明如何进行层次聚类分析。

2、(本题5分)详细说明如何使用支持向量机算法进行分类和回归任务,解释核函数的选择和作用,并举例应用。

3、(本题5分)详细说明在进行假设检验时,如何控制第一

文档评论(0)

yy9090990 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档