- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[spss软件决策树
使用决策树的预测建模
2.1 问题和数据探索 2-3
2.2 建模问题和数据难点 2-20
2.3 生成和解释决策树 2-46
2.1 问题和数据探索
内容:
问题和数据
初步数据探索
问题和数据
a. 预测建模问题
一家金融服务公司为其客户提供房屋净值信贷额度。该公司曾把该项贷款扩展给了数千客户,其中的许多接收者(大约20%)有贷款欺诈行为。该公司希望使用地理信息、人口信息、和经济状况信息变量建立一个模型预测一个申请人将来会不会欺诈。
b. 输入数据源
在对数据进行了分析之后,该公司选择了12个预测变量来建立每一个申请人是否欺诈的模型。输出变量(或目标)变量(BAD)表示申请人在房屋净值信贷中是否有欺诈活动。这些变量及其模型角色、测量水平、变量描述列表如下。
表 2.1 SAMPSIO.HMEQ 数据集合的变量
Name Model Role Measurement Level Description BAD Target Binary 1=defaulted on loan, 0=paid back loan REASON Input Binary HomeImp=home improvement, DebtCon=debt consolidation JOB Input Nominal Six occupational categories LOAN Input Interval Amount of loan request MORTDUE Input Interval Amount due on existing mortgage VALUE Input Interval Value of current property DEBTINC Input Interval Debt-to-income ratio YOJ Input Interval Years at present job DEROG Input Interval Number of major derogatory reports CLNO Input Interval Number of trade lines DELINQ Input Interval Number of delinquent trade lines CLAGE Input Interval Age of oldest trade line in months NINQ Input Interval Number of recent credit inquiries
需要的结果-信用评分模型
该信用评分模型给每一个贷款申请人计算还贷欺诈的概率。在此要设定一个阈值,欺诈概率超过阈值的那些申请人将建议不批准。
建立项目和数据初步探索
建造简单的过程流(Flow)
假定My Project 项目的Project1框图是开着的,通过从工具条上(或Tools标签)拖动Input Data Source节点到diagram工作区把节点加到Project1框图中。
把Multiplot 节点工作区Input Data Source 节点的右边. 你的框图看起来如下图
注意现在选中的是Multiplot 节点 (有虚线环绕), 而不是Input Data Source 节点. 如果你在工作区的空白地方点击一下,所有的节点都被放开。
除了把一个节点拖到工作区,另外还有两个方法把节点加入到流中。(You can right-click in the workspace where you want the node to be placed and select Add node from the pop-up menu, or you can double-click where you want the node to be placed. In either case, a list of nodes appears, enabling you to select the desired node.)
当把光标放在节点上面时,它就像一只小手。要在工作区内移动节点,
把光标放在节点上面直到小手出现
压下鼠标左边,把节点拖到期望的位置
放开鼠标左边.
连接工作区的两个节点:
确保Input Data Source 节点没有被选定. 如果这个起始节点是被选定的,在工作区的空白区点击一下解除选定。
把光标放在表示Input Data Source 节点的图标的边缘(直到十字号出现).
按住鼠标左边,立即向Multiplot 节点方向拖动. (如果你按住鼠标左边不立即拖动,你就会选定这个节点。拖动一个选定的节
文档评论(0)