- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.1 问题提出
2.1.1 预测建模案例
一家金融服务公司为其客户提供房屋净值信贷20%)有贷款欺诈行为。该公司希望使用地理信息、人口信息、和经济状况信息变量建立一个模型预测申请人将来会不会欺诈。
2.1.2 输入数据源
在对数据进行了分析之后,该公司选择了12个预测变量来建立申请人是否进行贷款欺诈的模型。输出变量(或目标)变量(BAD)表示申请人在房屋净值信贷
注意: 这本书的变量名使用大写字母。SAS 接受大小写混合的变量名以及小写字母的变量名。
表 2.1 SAMPSIO.HMEQ 数据集合的变量
SAMPSIO 文件夹里的HMEQ数据集合有5,960 条观测记录供建立和比较候选模型。该数据集合被划分为训练数据、验证数据、和测试数据集合用于分析。
2.2 创建过程流流程图
加入节点
现在开始建立第一个过程流来分析数据。使用EM工具条(Tools Bar)获取常用节点。你还可以往工具条(Tools Bar)上添加节点,方法是把节点从项目导航区(Project Navigator)的工具(Tools)标签拖拽到工具条(Tools Bar)。所有节点都还在工具(Tools)标签上。
从工具条(Tools Bar)或者项目导航区(Project Navigator)的工具(Tools)标签上拖拽一个输入数据源(Input Data Source)节点到工作区。因为这是一个预测建模流,我们把一个数据划分(Data Partition)节点放到输入数据源(Input Data Source)节点的右边。除了把一个节点拖拽到流程图工作区(Diagram Workspace)之外,还有两种方法往过程流加入节点。你可以在希望节点出现的工作区某地方右击鼠标并选择Add node, 或者在希望节点出现的工作区某地方双击鼠标。不管你使用哪种方法,一列节点将会呈现出来供你选择。在你选择数据划分(Data Partition)之后, 你的流程图如下:
注意数据划分(Data Partition)节点处于被选择状态(有虚线环绕),而输入数据源(Input Data Source)节点没有被选择。如果你在工作区的任何空白地方点击,所有节点都被脱选。
使用光标
光标的形状依赖于它所处的位置而发生变化。鼠标命令的行为依赖于光标的形状以及光标所指节点的选择状态。在空白区右击,得到一个弹出菜单显示如下:
最后3个菜单项 (连接物体,移动物体,移动并连接;Connect items, Move items, Move and connect) 用于修改光标被使用的方式。按缺省,移动并连接(Move and connect)项被选择,旁有星号为征。在此我们建议大家不要改变这一设置,因为用鼠标同时完成两个任务更为方便和有效,而不必要把光标设置调来调去。如果你的光标不工作,检查这个菜单以确保 Move and connect 条目被选择。这一选项使你能够在工作区内移动和连接节点。
注意:在你拖动一个节点后,该节点依然处于被选择状态。若要解除所有节点的被选择状态,需点击工作区的空白地区。当你把光标置于节点的边缘之处,它的形状是一个十字号。连接光标所指的节点(起始节点)和其它任意节点(终端节点)的步骤如下:
1 确保起始节点不处于被选择状态。这种状态下拉线更容易一些。如果起始节点被选择,点击工作区的空白处使之脱选。
2 把光标置于代表起始节点图标的边缘(直到十字号出现)
3 压下鼠标左键,立即开始把连线拖向终端节点。
注意: 如果在压下鼠标左键后没有立即拖连线,你只是选择了这个节点。拖动一个被选择的节点一般只会移动节点(即没有形成连线)。
4 在达到代表终端节点的图标边缘时释放鼠标左键。
5 在箭头远处点击空白处。连接一开始显示如下。当你点击工作区线外空白处后,带箭头方向线完成。
挑选输入数据
这个例子使用SAMPSIO 文件夹的HMEQ 数据集合。指定一个输入数据的方法是双击输入数据源(Input Data Source)节点,或者单击该节点并选择 Open. 数据(Data)标签处于活动状态。你的窗口图示如下。
点击Select选择数据集合。或者键入数据集合名称。
按缺省,被选择的文件夹是SASUSER。要浏览SAMPSIO文件夹的数据集合,点击箭头()并从列出的文件夹里选择SAMPSIO。从SAMPSIO文件夹里选择HMEQ数据集合,然后选择OK。输入数据源(Input Data Source)对话框出现。
这个数据集合里有5,960条观测记录(行)以及13个变量(列)。源数据集合的名称为SAMPSIO.HMEQ 。你也可以键入这个文件名而不用对话框进行选择。注意右下角表明元数据样本的大小为2,
您可能关注的文档
最近下载
- 一种基于压力监测的输液港自动封堵装置.pdf VIP
- 菠菜种植课件PPT.pptx VIP
- 紫色复古风《莴苣姑娘》童话故事PPT模板.pptx VIP
- 盐雾试验报告-.docx VIP
- [青海]水电站厂房机电设备安装工程量清单及招标文件.doc VIP
- 拓展低空经济应用场景实施方案.pptx VIP
- 第5课 中国古代官员的选拔与管理 课件(共45张PPT) 统编版高中历史选择性必修1(内嵌视频+音频).pptx VIP
- 时间序列分析—基于Python王燕习题答案.pdf VIP
- 百度AI营销认证初级考试理论知识题库(628题).docx
- 2025年电力安全工作规程(发电厂和变电站电气部分)题库(294道) .pdf VIP
文档评论(0)