- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2016数据分析方法02SPSS的数据文件汇编
数据分析方法及软件应用
授课教师:杨小宝
北京交通大学
2016.09
2017-4-10
第2章 SPSS的数据文件
2.1 SPSS数据文件的特点
2.2 定义变量属性(重点)
2.3 SPSS数据的录入、编辑(自学)
2.4 SPSS数据的保存
2.5 读取其他格式的数据文件(重点)
2.6 SPSS数据文件的合并(自学)
2.1 SPSS数据文件的特点
SPSS的数据文件扩展名是.sav;
SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,数据的内容才是那些待分析的具体数据。
数据
结构
数据
内容
基于上述特点,建立SPSS数据文件时应完成两项任务:
描述SPSS数据的结构(变量视图)
录入编辑SPSS数据的内容(数据视图)
(1) 原始数据的组织方式
数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。 SPSS数据文件的结构就是对每个变量及相关特征的描述。
SPSS数据的组织方式
直接的问
卷数据
(2)频数数据的组织方式
例:
职称
年龄段
35岁以下(1)
36-49岁(2)
50岁以上(3)
教授(1)
0
15
8
副教授(2)
10
20
2
讲师(3)
20
10
1
助教(4)
35
2
0
频数数据的组织方式中: 一行为变量的一个分组(或多
个变量交叉分组下的一个分组),所有行囊括了该变量
的所有分组情况,一列仍为一个变量,代表某个问题
(或某个方面)及频数。
分组汇总
后的数据
频数数据的组织方式—SPSS格式
职称
年龄段
人数
1
1
0
1
2
15
1
3
8
2
1
10
2
2
20
2
3
2
3
1
20
3
2
10
3
3
1
4
1
35
4
2
2
4
3
0
变量名(Name)
数据类型(Type)、宽度 (Width) 、列宽度(Columns)-重点
变量名标签(Label)
变量值标签(Values) -重点
缺失数据(Missing)
变量对齐格式(Align)
度量标准(Measure) -重点
2.2 定义变量属性
变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:
1.以前版本的首字符应以英文字母开头,20版本的可以直接是汉字开头。后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。
1) 变量名(Variable name)
定义时直接
录入即可
2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。
3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。
4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。
2) 数据类型(Type)
每种类型的变量都有自己的变量宽度、小数位和显示宽度,其中变量宽度是变量允许的最大字符位数,列宽度是数据编辑窗口中显示每列的字符位数。通常这两个宽度是一致的。
2) 变量宽度(Width)、显示宽度(Columns)
3) 变量名标签(Variable label)
变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计分析结果的可读性。
变量名标签可用中文,总长度可达120个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签信息。
定义时直接
录入即可
4) 变量值标签(Value label)
变量值标签是对变量取值含义的解释说明信息,对于品质型数据(定性数据包括分类和顺序数据)尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。
鼠标单击?再单击右边的省略号?
弹出值标签定义窗口?逐个添加
5) 缺失数据(Missing values)
数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。
数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。
SPSS用户缺失值定义窗口
鼠标单击?再单击右边的省略号?
弹出缺失值定义窗口?逐个添加
6) 变量对齐格式(Align)
定义显示对齐方式,对齐方式分为右对齐、左对齐和中间
您可能关注的文档
- 倾角传感器分解.ppt
- 2016广西公务员网络培训新发展理念公务员读本(40套)汇编.doc
- 倾听的意义分解.ppt
- 2016成考指导语文汇编.ppt
- 倾听和沟通分解.pptx
- 2016护士资格考试专业实务(真题+答案)汇编.doc
- 清澈的湖水公开课分解.ppt
- 2016护士资格考试专业实务真题与答案解析汇编.docx
- 清单_定额计量区别分解.doc
- 2016慢性伤口新进展汇编.ppt
- 2025年中国PVC钢丝增强软管生产线数据监测研究报告.docx
- 浙江省绍兴市2026届高三上学期11月诊断性考试(一模)通用技术试卷.docx
- 上海市民办万源城协和双语学校2024-2025学年上学期期中考试六年级信息科技试题.docx
- 浙江省稽阳多校2025届高三上学期11月联考信息技术试卷.docx
- 苏科版2023信息技术五年级上册第二单元第4课 组合运用控制结构 课件.pptx
- 2025年中国乳胶专用塑料壶数据监测研究报告.docx
- 义务教育版(2024)信息科技一年级全一册第三单元活动14《让我来为你点赞》教案.docx
- 第12课 警报采集结果 教学设计【教科版】《信息科技》八年级上册.docx
- 2025年中国彩印塑料包装袋数据监测研究报告.docx
- 2025年中国竹编工艺篮子数据监测研究报告.docx
最近下载
- 体育史 课件完整版.pptx VIP
- BS EN 12390-4-2019 Testing hardened concrete Part 4:Compressive strength – Specification for testing machines 硬化混凝土试验第4部分: 抗压强度试验机规范.pdf
- BS EN 12350-5-2019 新鲜混凝土试验.第5部分:流动表试验.pdf VIP
- BS EN 12350-4-2019 新鲜混凝土试验.第4部分:密实度.pdf VIP
- BS EN 12350-5-2019 Testing fresh concrete Part 5:Flow table test 新拌混凝土试验第5部分: 流动台试验.pdf
- 颈动脉支架成形术治疗颈动脉狭窄病人的护理.pdf VIP
- 重庆文理学院,校考,中国现当代作家作品选复习题1.doc VIP
- 重庆文理学院,校考,中国现当代作家作品选复习题2.doc VIP
- BS EN 12350-6-2019 Testing fresh concrete Part 6:Density 新浇混凝土试验第6部分: 密度.pdf
- 交叉配血标本采集流程.pptx VIP
原创力文档


文档评论(0)