SPSS在心数理据检查与筛选中的应用.docVIP

下载本文档

7
0
约9.24千字
约 7页
2017-03-01 发布于北京
举报
版权申诉

SPSS在心数理据检查与筛选中的应用.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

SPSS在心数理据检查与筛选中的应用

SPSS 在心理数据检查与筛选中的应用 SPSS 作为目前最流行的统计软件包, 以其功能强大、界面友好而被广泛使用. 但很多用户在数据录入完毕后就开始了统计分析, 这常常会导致结果的错误. 其实在这之前还有一项重要的工作要做就是数据的检查与筛选( screen2ing data). SPSS 在这方面为我们提供了很多有用的功能. 但很多用户常常忽略这些功能, 而目前的统计教材、SPSS 的教材中几乎没有这方面的专门论著, 我们以SPSS 最新的10. 0版本为例, 就在其中如何利用各种功能进行数据的检查与筛选进行探讨. SPSS 的其他版本及SA S, SPLM 等统计软件与此类似. 1　数据的采集、录入阶段数据产生差错的原因 1. 1　被试差错　多见于自陈式问卷调查中. 如: 由于社会赞许等原因导致被试对某问题不能真实回答从而造成数据偏态; 由于敏感的问题导致被试拒绝回答从而造成数据不全. 1. 2　仪器差错　多见于使用心理测评仪进行测量的时候.1. 3　主试差错　由于心理学数据常常非常庞大, 因此在数据录入时难免出错; 另外数据在文本文件、EXCEL、ACCESS、SPSS 等不同格式、不同版本之间转换时, 在心理测评仪向计算机传输数据时也常会发生错行、乱码等错误[1 ]. 2　数据的检查与筛选　保证数据准确的最好方法是将原始数据与计算机所呈现的数据清单进行核对. 但对庞大的数据这几乎是不可能的. 这时就需要应用描述性统计量和统计图来进行筛选和检测. 最重要的是解决三个问题: 所有的数据都在允许的范围内吗? 平均数和标准差都比较合理吗? 有无超出取值范围的数据? 2. 1　缺失值(m issing values) 　缺失值是数据分析中一个非常常见的现象, 出现的主要原因有: 设备故障、拒绝回答、测验时走神等, 对此应: 2. 1. 1　缺失值的检测　SPSS 默认缺失值以黑点表示, 可以通过快速浏览数据列表(data view ) 发现, 记录下缺失值所在的变量即数据的列. 2. 1. 2　对缺失值的处理　(1) 剔除有缺失值的观测单位, 即删除SPSS 数据列表中缺失值所在的数据行; 在SPSS 的统计分析程序中, 打开op t ions 按钮, 便会出现缺失值的处理栏(m issing values) , 可分别选择下列选项: exclude cases analy2sis by analysis (剔除正在分析的变量中带缺失值的观察单位) ; exclude case list w ise (剔除所有分析变量中带缺失值的观察单位) ; (2) 对缺失值进行估计后补上. 主要有两种方法:一是根据文献报道等知识经验进行估计; 二是用SPSS 提供的工具进行估计. 在“t ransfo rm ”菜单下的“rep lace m issingvalues”列出了5 种替代的方法: (a) series mean: 以列的算术平均值进行替代; (b)mean of nearly po int: 以缺失值邻近点的算术平均值进行替代; (c)M edian of nearly po int: 以缺失值临近点的中位数替代; (d) linear interpo lat ion: 根据缺失值前后的2 个观察值进行线性内查法估计和替代; (e) linear t rend atpo int: 用线形回归法进行估计和替代; (3) 将缺失值作为常数值, 如: 作为“0”. 2. 2　奇异值(out liers) 和极端值(ext reme values) 　奇异值和极端值是指各变量中与整体数据相距太远的极值, 由于它的夸大作用, 常常会歪曲统计结果, 导致犯一类和二类错误. 通常有四种原因可导致奇异值的出现: (1) 数据输入时出错; (2)在不同数据格式之间进行转换时, 缺失值处的数码代号被当成了实际观测值; (3) 出现奇异值的样本并非属于所要考察的总体; (4) 考察的样本相对于正态分布有比较多的极值.2. 2. 1　奇异值和极端值的检测　用柱状图、箱丝图、茎叶图、正态检验的Q 2Q 图等检测有无极端值和奇异值. 以箱丝图为例, 箱丝图中都标有奇异值的行号, 看不清时可拖动边框将箱丝图放大查看. 2. 2. 2　减少奇异值和极端值影响的方法　(1) 将奇异值和极端值作为缺失值处理: 在“variable view ”视图中点击“m issing”栏下含有奇异值和极端值的变量, 弹出“m issingvalues”对话框, 有3 个选项可以使用: (a)“discrete m issingvalues”最多可以指定3 个数值为缺失值, (b)“range of m iss2ing values”指定某一取值范围内的数值为缺失值;