2026年数据分析师资格考试题库及答案.docxVIP

  • 1
  • 0
  • 约4.54千字
  • 约 11页
  • 2026-05-29 发布于四川
  • 举报

2026年数据分析师资格考试题库及答案.docx

2026年数据分析师资格考试题库及答案

1.某零售企业欲分析用户消费行为中,最近30天消费频次、客单价、会员等级三个自变量对用户本年度复购率(取值范围0-100%的连续数值)的影响程度,以下模型中最适合的是()。

A.多元线性回归

B.Logistic回归

C.朴素贝叶斯分类

D.K均值聚类

答案:A

解析:多元线性回归用于分析多个自变量对连续因变量的影响关系,可清晰输出各自变量的影响系数和显著性,符合本题需求;Logistic回归适用于因变量为二分类或多分类的场景,朴素贝叶斯是有监督分类算法,K均值是无监督聚类算法,均不符合本题的分析目标。

2.以下方法中,不属于异常值检测常用方法的是()。

A.3σ原则

B.箱线图法

C.DBSCAN聚类法

D.小波变换法

答案:D

解析:3σ原则基于正态分布假设,将偏离均值3倍标准差以外的值判定为异常,是数值型数据异常检测的基础方法;箱线图法不依赖分布假设,将超出四分位距1.5倍范围的数值判定为异常,是最常用的异常值检测方法之一;DBSCAN聚类可以将远离高密度核心簇的低密度点识别为异常,适用于非结构化数据的异常检测,三者均属于异常值检测常用方法;小波变换主要用于信号处理、数据降维和特征提取,不属于异常值检测的常用方法。

3.现有订单表orders,包含字段order_id(订单ID)、user_id(用户ID)、create

文档评论(0)

1亿VIP精品文档

相关文档