- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
工商银行日照市数据分析师笔试题及答案
一、选择题(共5题,每题2分,合计10分)
1.在日照市商业银行客户数据分析中,以下哪个指标最能反映客户忠诚度?
A.客户交易频率
B.客户资产规模
C.客户活跃度(连续登录天数)
D.客户投诉次数
2.日照市某商圈的商户消费数据显示,周末销售额显著高于工作日,这体现了数据的什么特征?
A.线性关系
B.周期性波动
C.趋势性增长
D.异常值影响
3.在处理日照市工商银行信用卡用户的逾期数据时,以下哪种方法最适合用于缺失值填充?
A.均值填充
B.中位数填充
C.热门值填充(众数)
D.随机抽样填充
4.假设日照市某区域贷款申请人的信用评分与还款违约率呈负相关,以下哪个结论最合理?
A.信用评分越高,违约率越高
B.信用评分与违约率无关
C.信用评分越高,违约率越低
D.信用评分无法反映还款能力
5.在分析日照市中小企业融资需求时,以下哪个数据源最适合用于行业特征分析?
A.支付宝交易流水
B.天眼查企业工商信息
C.百度搜索指数
D.微信公众号文章阅读量
二、填空题(共5题,每题2分,合计10分)
1.在日照市分行客户分层中,RFM模型的三个核心维度分别是:Recency(最近一次消费时间)、Frequency(消费频率)和Monetary(消费金额)。
2.日照市某企业贷款数据中,若某月贷款余额环比下降20%,但逾期率上升5%,这表明该企业的流动性风险可能正在加剧。
3.在使用逻辑回归预测日照市个人贷款违约时,若某特征的P值小于0.05,则说明该特征对模型的显著性较高。
4.日照市某银行APP用户流失分析显示,70%的用户在注册后30天内未再次登录,这属于典型的沉默用户转化问题。
5.对日照市小微企业贷款数据进行特征工程时,通过One-Hot编码可以将分类变量转换为数值型特征,但需注意避免维度爆炸问题。
三、简答题(共3题,每题10分,合计30分)
1.简述在日照市工商银行开展客户流失预警时,数据预处理的主要步骤及其目的。
答案要点:
-数据清洗:处理缺失值(如用均值/中位数填充)、异常值(如箱线图识别后修正或剔除)、重复值(去重)。
-数据整合:将多源数据(如交易流水、征信报告)按客户ID合并,形成统一分析视图。
-特征工程:构造新特征(如“近3个月登录天数”“月均转账金额”),并筛选相关性强的特征。
-标准化/归一化:对数值型特征(如年龄、收入)进行缩放,避免模型偏向高量级变量。
目的:保证数据质量,提高模型准确性和可解释性。
2.结合日照市当地经济特点,说明如何利用数据分析优化小微企业贷款审批流程。
答案要点:
-地域特征分析:依据日照市“海洋经济”“化工产业”等支柱产业,为相关行业设置差异化风险权重。
-实时反欺诈:通过机器学习模型监测申请人的IP地址、设备行为等,识别“刷单”或“团伙贷”风险。
-动态授信调整:基于企业运营数据(如水电费缴纳记录、社保缴纳情况)实时评估还款能力,动态调整额度。
-可视化监控:建立仪表盘,实时展示贷款逾期率、行业集中度等关键指标,辅助决策。
3.在分析日照市信用卡用户消费行为时,如何通过聚类分析进行客户分群?请说明具体步骤及业务含义。
答案要点:
-数据准备:提取用户特征(消费金额、商户类型偏好、还款习惯等)。
-算法选择:采用K-Means聚类,通过肘部法则确定最优聚类数。
-结果解读:可能分出“高频大额用户”“日常通勤用户”“分期用户”等群体。
-业务应用:针对不同群体推送差异化营销(如高端用户送航空里程,分期用户推“免息日延展”)。
四、计算题(共2题,每题15分,合计30分)
1.某银行在日照市采集了1000名信用卡用户的月消费数据,其中:
-平均消费金额为8000元,标准差为2000元;
-逾期用户占比为5%,逾期金额占总消费的8%。
要求:
(1)计算该数据集的变异系数(CV);
(2)若某用户月消费金额为12000元,根据正态分布假设,其逾期概率是否异常?(假设逾期用户消费金额服从正态分布,均值为8000元,标准差不变)
答案:
(1)CV=标准差/均值=2000/8000=0.25(25%),表明数据离散程度较高。
(2)z=(12000-8000)/2000=2,查标准正态分布表,P(Z2)≈2.28%,若逾期概率基线为5%,则该用户逾期风险显著高于平均水平。
2.日照市某分行2023年个人贷款数据如下:
|月份数|贷款余额(亿元)|新增贷款(亿元)|逾期率(%)|
|--|-|-||
|1月|
文档评论(0)