信用评分卡开发流程纲要报告计划.docxVIP

  • 8
  • 0
  • 约4.2千字
  • 约 8页
  • 2021-06-05 发布于山东
  • 举报
精品文档 精品文档 精品文档 评 分 卡 开 发 流 程 文 档 一、数据集切分 将数据集按照70%与30%比率切分为训练集和测试集两部分; 二、分别对训练集与测试集进行数据预办理 衍生变量:进行衍生的变量 1) 未销户信用卡最近 6个月平均使用率 =未销户信用卡最近 6个月平均使用额度 /未 销户信用卡授信总额 未销户信用卡已使用率=未销户信用卡已用额度/未销户信用卡授信总额 String变量变换为数值型。 性别: 男=0;女=1;缺失=-1; 最高学历: 硕士及以上=5;本科=4;大专=3;高中=2;初中及以下=1;缺失=-1; 婚姻状况 已婚已育=5;已婚未育=4;离异=3;未婚=2;其他=1;缺失=-1; 现住房情况 多套自有=11;自有=10;小产权=9;宅基地房=8;共同拥有或与父亲母亲同住 =7;与 父亲母亲同住=6;租借或公司所有 =5;租房=4;自购现无贷款 =3; 自购现有贷款=2;其他=1;缺失=-1 单位职务 高层领导=3;中层领导=2;一般职工=1;缺失=-1; 单位性质 国有公司=4;政府机关=3;微型公司=2;民营公司=1;缺失=-1; 手机号码是否一致 一致=1;不一致=0;缺失=-1; 坏客户标签 坏客户=1 ;好客户 =0 缺失值办理 变量初分类:各变量元素个数检查 当变量元素数值个数=1,表示为常量;删除该变量; b) 当变量元素为数值且剔除缺

文档评论(0)

1亿VIP精品文档

相关文档