- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
中国银行抚州市数据分析师笔试题及答案
一、选择题(共5题,每题2分,计10分)
1.在抚州市商业银行客户数据分析中,若要评估某区域客户信用风险,最适合使用的统计方法是?
A.相关性分析
B.回归分析
C.聚类分析
D.主成分分析
2.抚州市某企业贷款逾期数据中,若逾期天数占比超过30%,则该数据属于?
A.正态分布
B.偏态分布
C.均匀分布
D.二项分布
3.中国银行抚州分行需分析客户消费行为,发现某类客户消费金额波动较大,最适合使用的平滑方法是?
A.移动平均法
B.指数平滑法
C.简单线性回归
D.时间序列分解
4.抚州市电商平台用户留存率下降,需分析原因,最适合使用的分析模型是?
A.决策树
B.神经网络
C.逻辑回归
D.K-means聚类
5.在抚州市小微企业信贷风控中,若要识别欺诈申请,最适合使用的模型是?
A.线性回归
B.朴素贝叶斯
C.支持向量机
D.决策树
二、填空题(共5题,每题2分,计10分)
1.抚州市某银行客户年龄数据呈右偏态分布,此时计算集中趋势应优先使用______。
(答案:中位数)
2.在抚州市房地产信贷分析中,若要评估房价与收入的关系,需使用______指标。
(答案:相关系数)
3.抚州某企业销售额数据包含大量异常值,此时计算离散程度应使用______。
(答案:标准差)
4.中国银行抚州分行客户流失分析中,若要预测客户是否流失,需构建______模型。
(答案:分类)
5.抚州市信用卡欺诈检测中,因欺诈样本较少,需采用______方法平衡数据。
(答案:过采样)
三、简答题(共3题,每题10分,计30分)
1.简述抚州市小微企业信贷数据分析中,如何处理缺失值?
答案:
-删除法:若缺失值占比低于5%,可直接删除含缺失值的样本;
-均值/中位数填充:适用于缺失值随机分布,如年龄、收入等;
-模型预测填充:使用KNN或回归模型预测缺失值,适用于缺失值与多变量相关;
-多重插补:通过模拟缺失值生成多个完整数据集,提高结果稳健性。
2.在抚州市商业银行客户信用评分中,如何评估模型的业务价值?
答案:
-AUC曲线:评估模型区分好坏客户的能力;
-KS值:计算最佳分界点下的区分能力;
-收益曲线:结合业务目标(如逾期率)计算预期收益;
-成本效益分析:比较模型应用后的成本(如核销率)与收益(如利息收入)。
3.抚州市某行业客户消费具有季节性特征,如何建立预测模型?
答案:
-时间序列模型:ARIMA、季节性分解时间序列(STL);
-混合模型:结合线性回归与季节性因子;
-机器学习模型:LSTM(长短期记忆网络)适用于复杂时序数据;
-特征工程:添加月份、节假日等变量增强模型效果。
四、计算题(共2题,每题15分,计30分)
1.抚州市某银行信用卡数据如下:
-逾期天数:5,0,3,0,8,2,0,5(单位:天);
计算:
a.样本均值、中位数;
b.方差与标准差;
c.若逾期天数超过3天视为高风险,计算高风险客户占比。
答案:
a.均值=(5+0+3+0+8+2+0+5)/8=2.75;
中位数=排序后第4、5个数的平均=(2+3)/2=2.5;
b.方差=[(5-2.75)2+(0-2.75)2+...]/8≈6.125;
标准差≈2.47;
c.高风险客户占比=(5+8)/8=62.5%。
2.抚州市某企业贷款数据:
-收入(万元):10,15,20,25,贷款逾期率分别为5%,8%,12%,15%;
要求:
a.绘制散点图并描述趋势;
b.建立线性回归模型,预测收入20万元时的逾期率;
c.解释模型斜率的业务含义。
答案:
a.散点图呈上升趋势,收入越高逾期率越高;
b.回归方程:逾期率=0.3×收入-1;
预测收入20万元时逾期率=0.3×20-1=5%;
c.斜率0.3表示收入每增加1万元,逾期率上升0.3个百分点。
五、论述题(共1题,20分)
抚州市某银行需分析客户流失原因,你将如何设计分析方案?
答案:
1.数据收集:整合客户基本信息(年龄、职业)、交易数据(消费金额、频率)、行为数据(APP使用情况)、流失标签;
2.探索性分析:
-描述性统计(流失/留存客户特征差异);
-相关性分析(如收入与流失率关系);
-可视化(如流失客户地域分布热力图);
3.模型构建:
-构建分类模型(如逻辑回归、XGBoost)预测流失概率;
-岭回归筛选关键流失因子;
4.业务验证:
-验证模型
文档评论(0)