- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年数据分析与处理技能测试题及答案
一、单项选择题(每题2分,共30分)
1.以下关于数据类型的描述中,正确的是:
A.客户满意度评分(1-5分)属于连续型数据
B.商品分类(食品/服装/家电)属于定距型数据
C.温度(℃)属于定比型数据
D.订单状态(未支付/已支付/已取消)属于定类型数据
答案:D
解析:A选项中1-5分是离散型数据;B选项商品分类无顺序,属于定类;C选项温度无绝对零点(0℃不代表没有温度),属于定距;D选项订单状态仅分类,无顺序,正确。
2.某数据集的偏度系数为-1.2,说明数据分布:
A.左偏(负偏),长尾在左侧
B.右偏(正偏),长尾在右侧
C.左偏,长尾在右侧
D.右偏,长尾在左侧
答案:A
解析:偏度系数为负时,均值小于中位数,数据左侧有较长尾部,属于左偏(负偏)。
3.以下SQL语句中,能正确计算每个用户2024年订单总金额的是:
A.SELECTuser_id,SUM(amount)AStotal_amountFROMordersWHEREorder_dateBETWEEN2024-01-01AND2024-12-31
B.SELECTuser_id,SUM(amount)AStotal_amountFROMordersGROUPBYuser_idHAVINGorder_dateBETWEEN2024-01-01AND2024-12-31
C.SELECTuser_id,SUM(amount)AStotal_amountFROMordersWHEREorder_dateBETWEEN2024-01-01AND2024-12-31GROUPBYuser_id
D.SELECTuser_id,SUM(amount)AStotal_amountFROMordersGROUPBYuser_idWHEREorder_dateBETWEEN2024-01-01AND2024-12-31
答案:C
解析:WHERE子句应在GROUPBY之前过滤数据,GROUPBY用于按用户分组汇总,正确顺序为WHERE→GROUPBY→SELECT。
4.使用Python的pandas库处理数据时,若要将DataFrame中age列的缺失值替换为该列的中位数,正确的代码是:
A.df[age]=df[age].fillna(df[age].mean())
B.df[age]=df[age].replace(np.nan,df[age].median())
C.df[age].fillna(df[age].median(),inplace=True)
D.df[age]=df[age].dropna().median()
答案:C
解析:fillna()用于填充缺失值,median()计算中位数;A选项用了均值(mean);B选项replace()一般用于替换特定值而非NaN;D选项错误地将整列替换为中位数。
5.某电商平台分析用户复购行为时,定义复购用户为90天内购买次数≥2次的用户。若要计算2024年Q1的复购率(复购用户数/总购买用户数),需明确的关键指标是:
A.新用户数与老用户数的划分
B.同一用户不同订单的时间间隔
C.订单支付时间的准确性
D.以上均是
答案:D
解析:复购率计算需明确用户标识唯一性(避免重复计数)、时间窗口(90天)的起始点、订单时间的准确性(确保在Q1内),以及新老用户的定义可能影响结果。
6.以下关于混淆矩阵的描述中,错误的是:
A.准确率=(TP+TN)/(TP+TN+FP+FN)
B.精确率=TP/(TP+FP)
C.召回率=TP/(TP+FN)
D.F1分数=2×(精确率×召回率)/(精确率-召回率)
答案:D
解析:F1分数的公式应为2×(精确率×召回率)/(精确率+召回率)。
7.在Tableau中创建动态筛选器时,若要让用户通过滑动条选择订单金额的范围(如100-500元),应使用的功能是:
A.参数(Parameter)
B.集(Set)
C.组(Group)
D.计算字段(CalculatedField)
答案:A
解析:参数可创建交互式控件(如滑动条),用于动态调整数值范围;集用于定义固定或动态的成员集合;组用于合并分类;计算字段用于自定义表达式。
8.某时间序列数据的ACF(自相关函数)在滞后1期显著,滞后2期及以上不显著,PACF(偏自相关函数)在滞后1-3期显著,最可能适用的模型是:
A.AR(3)
B.MA(1)
C.
您可能关注的文档
最近下载
- 2024教学心得体会:初中数学跨学科主题学习的设计与实施.docx VIP
- 《GB/T 18887-2023土工合成材料 机织/非织造复合土工布》.pdf
- 人教版八年级英语上册课件Unit 7《When Tomorrow Comes》(Project & Reading Plus).pptx VIP
- 小学数学数字化教学课件设计.docx VIP
- 丽水市水阁污水处理厂二期工程可行性研究报告.pdf VIP
- 工程项目场地平整设计说明.doc VIP
- 政治多选题题库及答案.doc VIP
- 2025年考研政治《史纲》专项训练试卷.docx VIP
- 2025年茶业可行性研究.pptx VIP
- Midea 美的 MRO1595-75G净水机 说明书.pdf
原创力文档


文档评论(0)