- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年数据分析师职业认证考试试题及答案
一、单项选择题(每题2分,共40分)
1.以下哪种数据类型同时具备顺序性和等距性,但无绝对零点?
A.定类数据
B.定序数据
C.定距数据
D.定比数据
答案:C
解析:定距数据(如温度)可以比较大小且间隔相等,但0不表示“无”;定比数据(如身高)有绝对零点。
2.某数据集的偏度系数为-1.2,说明数据分布呈现:
A.左偏(负偏),均值小于中位数
B.左偏(负偏),均值大于中位数
C.右偏(正偏),均值小于中位数
D.右偏(正偏),均值大于中位数
答案:A
解析:偏度为负时,数据左侧有长尾,均值受极端小值影响小于中位数。
3.以下哪项不是数据清洗中处理缺失值的常用方法?
A.直接删除含缺失值的记录
B.用变量均值填充
C.用K近邻算法预测填充
D.用相关变量的回归模型生成虚拟变量
答案:D
解析:生成虚拟变量(哑变量)用于分类变量编码,非缺失值处理方法。
4.在SQL中,要计算每个用户最近一次购买时间(字段为purchase_time),应使用:
A.MAX(purchase_time)OVER(PARTITIONBYuser_id)
B.MIN(purchase_time)OVER(PARTITIONBYuser_id)
C.ROW_NUMBER()OVER(PARTITIONBYuser_idORDERBYpurchase_timeDESC)
D.RANK()OVER(PARTITIONBYuser_idORDERBYpurchase_time)
答案:A
解析:MAX函数取每个用户分组的最大时间,即最近时间;窗口函数PARTITIONBY按用户分组。
5.用Python进行线性回归分析时,若发现自变量间存在严重多重共线性,最合理的处理方法是:
A.增加样本量
B.进行主成分分析(PCA)降维
C.对自变量取对数
D.剔除截距项
答案:B
解析:主成分分析可将高度相关的自变量转化为互不相关的主成分,降低共线性影响。
6.某电商平台用户行为数据中,“购买转化率”的计算公式是:
A.购买用户数/访问用户数
B.购买订单数/访问页面数
C.购买金额/访问时长
D.购买用户数/注册用户数
答案:A
解析:转化率核心是目标行为(购买)与初始行为(访问)的用户数比值。
7.以下哪种可视化图表最适合展示不同品类销售额随时间的趋势变化?
A.散点图
B.热力图
C.折线图
D.箱线图
答案:C
解析:折线图擅长展示连续时间序列的变化趋势。
8.在A/B测试中,若实验组的转化率为12%,对照组为10%,p值为0.02(α=0.05),结论是:
A.两组无显著差异
B.实验组转化率显著高于对照组
C.对照组转化率显著高于实验组
D.无法判断
答案:B
解析:p值<0.05,拒绝原假设(两组无差异),认为实验组有显著提升。
9.用Python的pandas处理数据时,若要将字符串列“日期”(格式为“2024-05-15”)转换为日期类型,应使用:
A.pd.to_datetime(df[日期])
B.df[日期].astype(datetime64)
C.pd.to_timedelta(df[日期])
D.df[日期].str.split(-)
答案:A
解析:pd.to_datetime是标准的字符串转日期函数。
10.以下哪项属于非监督学习任务?
A.预测用户是否会流失(二分类)
B.对用户评论进行情感分析(正/负)
C.将用户分成高、中、低价值群体(聚类)
D.预测产品销量(回归)
答案:C
解析:聚类无标签,属于非监督学习;分类、回归均为有监督。
11.某数据集的峰度系数为3.5,说明数据分布:
A.比正态分布更陡峭(尖峰)
B.比正态分布更平缓(平峰)
C.呈均匀分布
D.呈指数分布
答案:A
解析:正态分布峰度为3,大于3时数据更集中在均值附近,尾部更厚(尖峰)。
12.在SQL中,要查询2024年1月所有订单中,金额超过该月平均金额的记录,正确的子查询是:
A.SELECTFROMordersWHEREorder_dateBETWEEN2024-01-01AND2024-01-31ANDamoun
您可能关注的文档
- 2025年加气站安全培训试题库及答案.docx
- 2025年矿井通风机运行维护题库(附答案).docx
- 2025年矿井主通风机切换操作题库(附答案).docx
- 2025年矿山提升机制动距离题库(附答案).docx
- 2025年母婴保健技术人员培训考试题附答案.docx
- 2025年木材厂木材防腐处理安全试题库及答案.docx
- 2025年木材厂木材刨光安全试题库及答案.docx
- 2025年内蒙古赤峰市辅警招聘公安基础知识考试题库及答案.docx
- 2025年内蒙古呼和浩特市辅警招聘公安基础知识考试题库及答案.docx
- 2025年内蒙古通辽市辅警招聘公安基础知识考试题库及答案.docx
- 2025年远程会诊报告:三甲基层合作模式资源分配.docx
- 广安市农业农村局2025年公开遴选市动物卫生监督所工作人员行测备考题库附答案.docx
- 宜宾市珙县事业单位2025年第一次公开选调工作人员行测备考题库(13人)附答案.docx
- 宜宾市叙州区事业单位2025年第二次公开考试选调工作人员行测备考题库附答案.docx
- 宜宾市市属事业单位2025年第一次公开选调工作人员行测备考题库(47人)附答案.docx
- 2025年中药材在线销售平台建设指南.docx
- 大米市场定位与营销策划方案.docx
- 《2025年宠物哀伤咨询服务的情感化设计与行业应用前景》.docx
- 2025年兽医远程诊断设备市场潜力与成本分析.docx
- 公司财务风险控制与管理方案.docx
原创力文档


文档评论(0)