第四周 数据录入与获取02.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四周 数据录入与获取02

* * ——外部数据的获取 * * 如果我们直接开启spss软件进行数据的录入与整理,那么数据创建后可以立即进行统计分析程序。但是如果我们不是使用spss数据编辑工作窗口来建立变量与数据文件,而是利用其它的软件来建立数据,则可以利用spss转文件的方法将数据文件输入在spss数据编辑窗口中。 在实际工作中excel电子表格、access等数据处理软件非常普及,因此我们有必要学习常用格式但非spss数据文件的导入方法。 * * 对于spss格式的数据,只要选择【文件】——【打开】——【数据】菜单项,然后选择文件路径和文件名打开即可。 如果不是spss格式的文件,也可以直接读入spss,用spss进行分析。spss可以读入许多非spss默认类型的数据文件,方式主要有三种,包括直接打开、利用文本向导读入文本数据,以及利用数据库ODBC接口读取数据。对于这三种方法,下面将以常见的EXCEL格式的数据、TXT数据和ACCESS数据为例,介绍spss获取数据的功能。 * * 1.spss可支持的文件类型 在spss中可以直接读入许多常用格式的数据文件,选择【文件】——【打开】——【数据】菜单项,或直接单击快捷工具栏上的快捷按钮,,系统就会弹出【打开数据】对话框,在【文本类型】列表框中可以看到直接打开的数据文件格式,spss在这方面的兼容性做的非常出色,和许多常见的数据格式都有直接读取的接口。 * * 2.读取excel文件程序(以spss自带文件demo.xls为例) 该文件位于spss安装目录下的samples子目录中。 首先在excel中打开demo.xls,了解一下文件的结构,重点了解这样几项内容: 第一,该文件中包含几个数据表,具体应打开哪个表; 第二,如果不需要该表所有数据,而只需要读取一部分,这时需要了解要读入数据的精确位置,如单元格A2:F5; 第三,此部分数据的第一行是否是变量名。从这个文件中可以看出,第一行是变量名,该文件只有一个表,要读取的是该表单中的全部数据。 * * 第一步,在“打开文件”对话框中,选择路径(文件存储位置),选择文件类型excel(.xls),文件列表中出现所有的excel文件,单击demo.xls; 第二步,打开如图所示对话框:在“工作表”下拉表框中选择一个表;在“范围”文本框中指定读取的数据的具体位置,用单元格的起(左上角单元格名称如A2)止(右下角单元格名称如F5)位置来表示,中间用冒号“:”隔开;上方的复选框用于确定单元格范围的第一行是否为变量名。指定完毕,单击“确定”按钮,数据就会被顺利的读入spss中。 * * 这种直接读取的方法要优于“复制+粘贴”,采用这种方法不仅可以顺利地进行变量名的转化,最重要的是可以直接读取字符型变量,若采用“复制+粘贴”的方法,字符型 变量就会全部变成缺失值了,并且操作简单,不易出错,就和读取spss自己的文件一样方便。 * * spss可以通过两种菜单操作方式读取文本数据:一种是选择【文件】——【打开文本数据】(检索)菜单项; 另一种是选择【文件】——【打开】——【数据】菜单项,这两种操作是一样的,系统会弹出打开数据对话框,只是前者的文件类型自动跳到了text(*.txt),后者需要在“文件类型”下拉表框中进行选择。 * * 与读取excel数据一样,首先打开该数据,观察这个数据基本结构,如变量间是固定宽度还是用某种分隔符区分,第一行是否为变量名等。然后关掉这个文本文件。 接着打开spss软件。首先,在“打开文件”对话框选择相应文件并单击“确定”按钮,系统会自动打开“文本导入向导”对话框,如图所示,从对话框标题可以看出该向导分为六步。 * * (1)系统会首先询问有无预定义格式,如下图所示,如果有则在此处选择相应文件。一般而言,使用者所建立的数据文件通常不会符合预先定义的格式,因此选【否】选项,按【下一步】按钮。 (2)在“第2步”对话框中,“变量是如何排列的?”按钮组中有两个选项:【分隔】、【固定宽度】,文本文件中如果以逗号、Tab键、空白字段来分隔变量,可以选取【分隔】按钮。(一般文本文件采取固定字段宽度的方式较为简便。因为使用者以分隔方式创建文件较为不便。)如果变量间以空白字段来分隔变量,也可以采用【固定宽度】的方式。 * * “变量名称是否包括在文件顶部?”按钮组有两个选项:【是】和【否】,如果文件中有变量名,则需要将点选【是】。如果文件没有把变量名输入在第一横行中,则需选择【否】。然后单击【下一步】按钮。 * * (3)第3步:“第一个数据个案从哪个行号开始?”可以点选相关的数值,默认值为1,表示数据的第一个个案从第一个横行开始。如果数据文件不是从第一横行开始,则需要更改。(这里主要要考虑数据文件第一行是否为变量名) * * “

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档