2025年春国开《大数据分析与挖掘技术》形考任务1-3及实验报告题库.pdfVIP

2025年春国开《大数据分析与挖掘技术》形考任务1-3及实验报告题库.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

形考任务1(阶段性学习测验,第1-3章,权重20%)

一、单项选择题(共10题,每题4分,共40分)

1.

请问在Python中缺失值通常用()来记号。

单选题(4分)

A.

NaN

B.

C.

NA

D.

na

2.

请问不是缺失值通常用的处理方式是()o

单选题(4分)

A.

填补

B.

删除

C.

插补

D.

提取

3.

数据整合后()o

单选题(4分)

A.

数据量会增加

B.

数据量会不变

C.

数据的波动性增加

D.

数据波动性减小

4.

数据离散化可以采用()方式。

单选题(4分)

A.

等宽或者等频

B.

插补

C.

抽样

D.

查询

5.

下面关于主成分分析说法误的是()。

单选题(4分)

A.

主成分是相互正交(垂直)的

B.

主成分捕获了数据差异最大的方向

C.

是线性降维方法

D.

是非线性降维方法

6.

数据经过标准化处理后()o

单选题(4分)

A.

数据的波动性将会增加

B.

数据的波动单位为1

C.

数据的波动性将会减小

D.

数据值将被放大

7.

白化是指()o

单选题(4分)

A.

从相关矩阵出发求解主成分

B.

从协方差矩阵出发求解主成分

C.

将数据进行标准化

D.

剔除数据中的异常值

8.

分类模型评价时,通常采用()损失。

单选题(4分)

A.

0-1损失

B.

指数

C.

绝对值

D.

平方

9.

不是回归模型常采用的评价指标是()o

单选题(4分)

A.

MAE

B.

MSE

C.

R2

D.

准确率

10.

期望预测误差是指()o

单选题(4分)

A.

真实值与预测值在某种损失函数下的平均值

B.

真实值与预测值之差

C.

真实值与预测值在某种损失函数下的值

D.

真实值与预测值之比

二、多项选择题(共6题,每题5分,共30分)

11.

缺失数据的处理方法包括()o

多选题(5分)

A.

填补

B.

删除

C.

插补

D.

提取

12.

数据抽样后()o

多选题(5分)

A.

数据量会增加

B.

数据量会减少

C.

数据的波动性可能增加

D.

数据波动性可能减小

13.

下面关于主成分分析说法正确的是()o

多选题(5分)

A.

主成分是相互正交(垂直)的

B.

主成分捕获了数据差异最大的方向

C.

是线性降维方法

D.

是非线性降维方法

14.

期望预测误差中的方差部分是由()带来的。

多选题(5分)

A.

最优解所在空间假设失误

B.

数据的随机性

C.

估计值自身的波动

D.

估计值的平均可能偏离了真实值

15.

聚类分析的外部评价指标通常有()o

多选题(5分)

A.

DBI

B.

兰德指数

C.

Jaccar系数

D.

FM指数

E.

DI

16.

分类任务的评价指标通常采用()o

多选题(5分)

A.

准确度

B.

ROC曲线

C.

特效度

D.

灵敏度

E.

分成本

三、判断题(共10题,每题3分,共30分)

17.

主成分分析中最大的特征值对应的特征向量也就是是数据差异最大的的方向。

判断题(3分)

A.对

B.

您可能关注的文档

文档评论(0)

鼎天教育 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月13日上传了教师资格证

1亿VIP精品文档

相关文档