- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据分析笔试题库及答案
一、单选题(共10题,每题3分)
以下哪种数据类型属于离散型数据?()
A.用户的身高
B.商品的销售金额
C.每月的订单数量
D.产品的重量
答案:C
解析:离散型数据是指只能取有限个或可列无限个值的数据,订单数量为整数,无法取小数,属于离散型;A、B、D均为连续型数据,可在一定区间内取任意值。
在分析某电商平台用户消费能力时,若存在少量高消费用户(消费金额远超其他用户),下列哪种统计量更能反映用户平均消费水平?()
A.算术平均数
B.中位数
C.众数
D.方差
答案:B
解析:算术平均数易受极端值(高消费用户)影响,会高估平均水平;中位数不受极端值影响,能更客观反映中间用户的消费水平;众数是出现频率最高的数值,无法体现“平均”;方差反映数据离散程度,与平均水平无关。
数据清洗过程中,针对“用户年龄为-5岁”这类数据,最合理的处理方式是?()
A.保留数据,标记为“特殊用户”
B.用平均值替换
C.直接删除该条数据
D.确认数据录入错误,联系业务方修正或删除
答案:D
解析:年龄为负数属于明显的逻辑错误数据,并非合理的缺失值或异常值,首先应确认是否为录入错误,若无法修正则删除,避免影响分析结果;A会导致错误数据干扰,B用平均值替换无逻辑依据,C未先排查错误原因,处理过于草率。
相关系数r的取值范围是?()
A.0≤r≤1
B.-1≤r≤1
C.-∞≤r≤+∞
D.-1r1
答案:B
解析:相关系数用于衡量两个变量的线性相关程度,取值范围为[-1,1],r=1为完全正相关,r=-1为完全负相关,r=0为无线性相关。
某APP想分析“用户从打开APP到完成支付”的转化过程,应选用哪种分析方法?()
A.漏斗分析
B.聚类分析
C.回归分析
D.因子分析
答案:A
解析:漏斗分析通过拆解关键步骤(如打开APP→浏览商品→加入购物车→完成支付),计算各步骤转化率,定位转化瓶颈;B用于将数据分组,C用于预测变量关系,D用于降维提取关键因子,均不适用转化路径分析。
在假设检验中,若P值小于显著性水平α(如α=0.05),则结论是?()
A.接受原假设
B.拒绝原假设
C.无法判断
D.原假设成立概率为P值
答案:B
解析:P值代表“在原假设成立的前提下,出现当前观测结果及更极端结果的概率”,若Pα,说明原假设成立的概率极低,需拒绝原假设;反之则接受原假设。
时间序列分析中,“趋势性”指的是数据随什么因素呈现的长期变化规律?()
A.季节因素
B.随机因素
C.时间因素
D.周期性因素
答案:C
解析:趋势性是数据随时间推移呈现的持续上升、下降或平稳的长期规律(如某产品年销售额逐年增长);A是短期季节性波动(如春节前家电销量上涨),D是固定周期重复的波动(如每3年一次的行业周期),B是无规律的随机波动。
下列哪种情况适合使用聚类分析?()
A.预测某商品下个月的销售额
B.将用户按消费习惯分成不同群体
C.分析广告投入与销售额的关系
D.判断用户是否为潜在付费客户
答案:B
解析:聚类分析是无监督学习,核心是将相似数据归为一类,适合用户分群、商品分类等场景;A用回归分析,C用相关分析或回归分析,D用分类算法(如逻辑回归、决策树)。
某平台“7日留存率”的定义是?()
A.当天新增用户中,7天后仍活跃的用户占比
B.当天活跃用户中,7天后仍活跃的用户占比
C.7天内所有活跃用户中,当天活跃的用户占比
D.当天新增用户中,7天内累计活跃的用户占比
答案:A
解析:留存率核心是“新增用户在后续时间段的活跃情况”,7日留存率=(当天新增用户中7天后活跃的用户数/当天新增用户总数)×100%;B是活跃用户留存,非标准定义,C、D逻辑错误。
A/B测试中,影响样本量的关键因素不包括?()
A.显著性水平
B.最小可检测效应
C.历史转化率
D.产品上线时间
答案:D
解析:样本量计算需考虑显著性水平(α,如0.05)、最小可检测效应(MDE,如转化率提升2%)、历史转化率(基准数据)、统计功效(1-β,如0.8);产品上线时间与样本量无直接关联,仅影响测试周期。
二、多选题(共5题,每题4分,多选、少选、错选均不得分)
下列属于描述统计分析的指标有?()
A.平均值
B.中位数
C.回归系数
D.标准差
E.置信区间
答案:ABD
解析:描述统计用于概括数据特征,包括集中趋势(平均值、中位数、众数)和离散程度(标准差、方差、极差);C是推断统计中回
您可能关注的文档
最近下载
- 气象学重点 农林气象学思考题.docx VIP
- T_CPQS XF003-2023 灭火器产品维修、更换及售后服务.docx VIP
- DB5325T 123-2025 设施蓝莓采收与贮藏技术规程.docx VIP
- 1共析转变.ppt VIP
- 操作系统原理(全套1236页PPT课件).pptx VIP
- 计算机操作员中级实操试卷资料.docx VIP
- DB5325T123-2025 设施蓝莓采收与贮藏技术规程.pdf VIP
- 农林气象学模拟题.doc VIP
- TCPQS+XF006-2023 消防水带产品维护、更换及售后服务.docx VIP
- 广东省2024年普通专升本《管理学》真题-广东专插本最前线.pdf VIP
原创力文档


文档评论(0)