- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
交通银行成都市数据分析师笔试题及答案
一、选择题(共5题,每题2分,计10分)
1.在交通银行成都分行,若要分析某区域客户信贷违约风险,最适合使用的统计模型是?
A.线性回归模型
B.决策树模型
C.逻辑回归模型
D.K-Means聚类模型
2.成都市居民消费支出数据呈右偏分布,若需计算该数据的代表性指标,应优先选择?
A.均值
B.中位数
C.标准差
D.峰度
3.交通银行成都分行APP用户行为分析中,衡量用户活跃度的常用指标是?
A.用户总数
B.日活跃用户数(DAU)
C.用户留存率
D.平均交易金额
4.若某客户在成都地区的信用卡使用频率较低,但单次消费金额较高,这种行为模式可能属于?
A.习惯性消费
B.偶发性大额消费
C.风险高客户特征
D.价格敏感型客户
5.在交通银行成都分行信贷业务中,用于评估客户信用风险的评分卡模型,其核心变量通常包括?
A.年龄、收入、负债率
B.居住地、职业、婚姻状况
C.消费习惯、交易频率、信用历史
D.以上所有
二、填空题(共5题,每题2分,计10分)
1.交通银行成都分行若需分析春熙路商圈信用卡交易特征,应关注的关联规则挖掘算法是__________。
2.成都市小微企业信贷业务中,用于衡量贷款违约可能性的统计指标是__________。
3.数据分析中,若成都市某区域客户年龄分布集中,则该群体属于__________型客户。
4.交通银行APP用户画像分析中,常用的聚类算法有__________和__________。
5.若成都市某客户短期内频繁申请信用卡,但审批均被拒,可能的原因是__________。
三、简答题(共3题,每题10分,计30分)
1.简述交通银行成都分行在分析小微企业信贷风险时,如何利用数据挖掘技术识别潜在风险客户?
2.成都市消费信贷业务中,若发现某区域客户违约率异常偏高,如何通过数据分析定位问题原因?
3.结合成都市金融监管政策,说明交通银行在数据合规前提下,如何平衡信贷业务增长与风险控制?
四、计算题(共2题,每题15分,计30分)
1.某客户在交通银行成都分行的信用卡月交易数据如下表,请计算该客户的平均交易金额、中位数及标准差。
|月份|交易金额(元)|
||-|
|1月|1200|
|2月|1800|
|3月|1500|
|4月|2000|
|5月|1600|
2.交通银行成都分行某区域信用卡用户数据如下:违约用户占比为20%,非违约用户占比为80%。若某客户信用评分低于阈值为高风险客户,评分高于阈值为低风险客户,已知高风险客户违约概率为30%,低风险客户违约概率为5%。现随机抽取一名客户,求该客户违约的总体概率?
五、论述题(1题,20分)
结合成都市金融科技发展趋势,论述交通银行如何通过数据分析技术提升客户服务体验与业务效率。
答案及解析
一、选择题答案及解析
1.C.逻辑回归模型
解析:信贷违约风险属于分类问题,逻辑回归模型适用于预测二分类结果(违约/不违约),而线性回归、决策树和聚类模型不直接适用于此类场景。
2.B.中位数
解析:右偏分布中,均值易受极端值影响,中位数更能代表数据的集中趋势。标准差衡量波动性,峰度描述分布形状,非代表性指标。
3.B.日活跃用户数(DAU)
解析:DAU是衡量用户即时活跃度的核心指标,比用户总数更能反映活跃程度;留存率关注长期行为,平均交易金额侧重消费能力。
4.B.偶发性大额消费
解析:该行为模式可能属于高净值客户的小额高频消费习惯,而非风险特征。价格敏感型客户通常交易频率高但金额低。
5.A.年龄、收入、负债率
解析:信用评分卡模型的核心变量通常包括客观数据(如收入、负债),而非主观或行为性指标。居住地、职业等辅助参考。
二、填空题答案及解析
1.Apriori算法
解析:春熙路商圈交易数据需挖掘商品关联性(如“购买服装→信用卡支付”),Apriori适用于频繁项集挖掘。
2.违约概率(PD)
解析:信贷风险核心指标,通过历史数据统计计算,反映违约可能性。
3.集中型
解析:年龄分布集中表示客户群体特征稳定,便于精准营销。
4.K-Means、DBSCAN
解析:K-Means适用于分桶聚类,DBSCAN适用于不规则形状聚类,均适用于用户画像分析。
5.征信记录差
解析:频繁申请但被拒可能因逾期、负债高或欺诈行为,需结合征信数据排查。
三、简答题答案及解析
1.答案:
-数据采集:整合企业工商信息、
文档评论(0)