网站大量收购闲置独家精品文档,联系QQ:2885784924

使用导出选择节点抽取样本.PPT

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
使用导出选择节点抽取样本

? 2006 SPSS Inc. SPSS Inc. Copyright 2006 SPSS Inc. Clementine的数据处理 介绍Clementine的数据处理技术,学习如何合并和处理文件,样本数据,处理缺失值和时序数据 培训内容 第一章 合并多个数据源数据 第二章 抽取样本,选择和缓存数据 第三章 处理缺失数据 第四章 处理日期 第五章 处理时序数据 第六章 文件操作 第七章 效率 第一章 合并多个数据源数据 第一章 合并多个数据源数据 内容: 使用追加节点串联包含相似字段的记录集的文件 使用合并节点把不同数据源的信息加入到现有数据源 使用超级节点简化数据流区域的内容 数据: acct97.txt, accounts98.sav, customer.dat 追加节点合并数据文件 不同组记录的相似信息有可能存储在不同数据文件 不同财政年度的银行帐目信息 不同学年的考试结果 不同部门的欺诈信息 不同周的事务办理数据 追加节点可以合并两个或者更多的数据源,可以分析和比较不同记录组的相似信息。 文件读入 追加节点读取并下传来自同一数据源的所有记录直至该数据源不再有记录为止,然后读取下一个数据源的记录。 第一个读入的数据源的数据结构(记录和字段数目等)默认为输出数据的数据结构。 追加节点假定读入的数据源和最初输入源有相似的数据结构,根据不同数据文件的字段名合并数据。 字段数目不同时的读入规则 如果一个输入的字段数目比最初数据源少,输入源记录缺失的字段用未定义值($null$)填补。 如果一个输入的字段数目比最初数据源多,默认为从流中过滤掉多余的字段,有一个选项可以允许输入所有数据集的字段,所有记录缺失的字段用未定义值($null$)填补。 追加文件 使用变量文件节点读入文件acct97.txt 确定选中“从文件读取字段名” 使用SPSS文件节点读入文件accounts98.sav 使用追加节点连接两个数据源节点 使用制表节点分别输出表格 输入条目改变主数据集 条目设置 处理字段 使用导出节点和子链函数提取字段 substring (1, 2, ACCTNO)提取字段ACCT substring (4, 5, ACCTNO)提取字段CUSTREF substring (10, 5, ACCTNO)提取字段ACCTREF 使用过滤节点过滤字段ACCTNO 数据流和追加文件 合并节点合并数据文件 在很多企业里,个体的信息存放于不同数据源中 消费者信息和购买信息 账目详细资料和事务办理数据 房产商的信息按照个体和财产水平 同样本调查中每隔一段时间收集的个体的信息 合并节点可以合并两个或者更多的数据源,可以整体分析个体存放于不同数据源中的信息。 合并文件 使用变量文件节点读入文件customer.dat 确认选中从文件读取字段名 分隔符选中制表符,取消逗号分隔符 使用合并节点连接变量文件节点和追加节点 选中按照关键字段 包括匹配和不匹配记录 使用制表节点输出表格 合并方法 按照顺序合并数据:如每一输入的第n 个记录被合并生成第n 个输出记录。只要任一记录缺少匹配的输入记录,则不会生成任何输出记录。 按照关键字段合并数据:如果某一关键字段值不止一次的出现,则返回所有可能的组合。 只包括匹配记录(内部合并) 包括匹配和不匹配记录(完全外部合并) 包括匹配和选中的不匹配记录(部分全外部合并) 包括第一个数据集中且不与其它数据集匹配的记录(反向合并) 合并相同的关键字段:每个输出字段都有不同的字段名 外部合并选择数据集 超级节点简化数据流 超级节点在流中用星型图标表示,图标的明暗程度表示超级节点的类型和流的方向(流向或者流出) 总共有三种类型的超级节点: 源超级节点 过程超级节点 终端超级节点 超级节点 规则 两个选中的节点之间必须有路径通过。 一个完整的流不能压缩为一个超级节点。 要压缩的部分流不能包括分叉路径(终端超级节点在每个分叉路径包含终端节点除外)。 操作 创建超级节点 编辑超级节点 保存超级节点 练习 custtravel1.dat,custtravel2.dat 记录旅游公司顾客的信息,holtravel.dat记录不同假期,公司提供的旅游信息,合并三个数据文件。 使用变量文件节点分别读入这三个数据文件。 连接三个制表节点,检查数据文件的读入是否正确。 用Append节点,追加两个记录顾客信息的数据文件。编辑节点,并检查节点设置是否正确(确保custtravel1.dat是第一个数据文件),用制表节点,查看追加结果。 用Merge节点,合并holtravel.dat和生成的数据文件,选择包括匹配和不匹配记录。用制表节点,查看合并结果。 第二章 抽取样本,选择和缓存数据 第二章 抽取样本,选择和

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档