- 8
- 0
- 约1.8万字
- 约 39页
- 2017-08-19 发布于江苏
- 举报
使用决策树的预测建模
2.1 问题和数据探索 2-3
2.2 建模问题和数据难点 2-20
2.3 生成和解释决策树 2-46
2.1 问题和数据探索
内容:
问题和数据
初步数据探索
问题和数据
a. 预测建模问题
一家金融服务公司为其客户提供房屋净值信贷额度20%)有贷款欺诈行为。该公司希望使用地理信息、人口信息、和经济状况信息变量建立一个模型预测一个申请人将来会不会欺诈。
b. 输入数据源
在对数据进行了分析之后,该公司选择了12个预测变量来建立每一个申请人是否欺诈的模型。输出变量(或目标)变量(BAD)表示申请人在房屋净值信贷 2.1 SAMPSIO.HMEQ 数据集合的变量
Name Model Role Measurement Level Description BAD Target Binary 1=defaulted on loan, 0=paid back loan REASON Input Binary HomeImp=home improvement, DebtCon=debt consolidation JOB Input Nominal Six occupational categories LOAN Input Interval Amount of loan request MORTDUE Input Interval Amount d
原创力文档

文档评论(0)