德国信用数据集的描述.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
德国信用数据集的描述

德国信用数据集的描述。1.标题:德国信用数据2.源信息汉斯霍夫曼教授统计研究所和“经济汉堡系计量经济学大学”冯·梅勒园52000汉堡133.实例数:1000提供了两个数据集。原始数据集,由霍夫曼教授以提供的形式,包含分类/符号属性和是在文件“german.data”。对于需要数值属性的算法,斯特拉斯克莱德大学产生文件“german.data-numeric”。此文件已编辑并添加了几个指示符变量以使其适合不能处理分类变量的算法。一些排序分类(例如属性17)的属性被编码为整数。这是StatLog使用的形式。6.german文件包括20个变量: 20 (7 numerical, 13 categorical)german.numer文件包括24个变量: 24 (24 numerical)7.德国人的属性描述属性1:(定性)现有支票帐户的状态???A11:... 0 DMA12:0 = ... 200DMA13:... = 200 DM/工资分配至少1年???A14:不检查帐户属性2:(数值)月份持续时间 A2属性3:(定性)信用记录A30:没有学分/所有积分支付回来A31:所有在这家银行的信用卡已收回A32:到现在支付的现有贷项?? A33:延迟过去的回报A34:关键帐户/存在的其他信用(不在此银行)属性4:(定性)目的A40:汽车(新)A41:汽车(使用)A42:家具/设备A43:广播/电视A44:家用电器A45:修理A46:教育A47:(vacation - 不存在?)A48:再培训A49:业务A410:其他属性5:(数值)信用额A5Attibute 6:(定性)储蓄账户/债券A61:... 100 DMA62:100 = ... 500DMA63:500 = ... 1000DMA64:.. = 1000 DM??A65:未知/不存储储蓄帐户属性7:(定性)目前就业A71:失业A72:... 1年A73:1 = ... 4年A74:4 = ... 7年A75:.. = = 7年属性8:(数值)分期付款率按可支配收入的百分比计算A8属性9:(定性)个人地位和性别A91:男:离婚/分居A92:女性:离婚/分居/已婚??A93:男:单身A94:男性:已婚/丧偶A95:女:单身属性10:(定性)其他债务人/担保人A101:无A102:共同申请人A103:担保人属性11:(数值)现在居住地A11属性12:(定性)属性A121:房地产A122:如果不是A121:建筑社会储蓄协议/人寿保险??A123:如果不是A121 / A122:汽车或其他,不属于属性6A124:未知/无属性属性13:(数值)年龄A13属性14:(定性)其他分期付款计划A141:银行A142:商店A143:无属性15:(定性)住房A151:租金A152:自己A153:免费属性16:(数值)此银行现有的信用额A16属性17:(定性)工作A171:失业/非技术 - 非居民A172:不熟练A173:熟练的员工/官员A174:管理/个体经营/高度合格的员工/官员属性18:(数值)负责提供维修的人数A18属性19:(定性)电话A191:无A192:是,以客户名称注册属性20:(定性)外国工人A201:是的A202:不8.成本矩阵此数据集所需要使用成本矩阵(参见下文) 1 2---------------------------- 1 0 1----------------------- 2 5 0(1 =好,2 =差)其中,行表示实际分类和列表示预测分类。将坏客户分类为好客户的成本较大为5个单位,而将好客户分类为坏客户的成本为1个单位。

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档