- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈心理学问卷调查中缺失值的处理方法
钟 欣
(湖北大学 教育学院,湖北 武汉 430062)
[摘 要] 在心理学研究中,数据的质量直接影响着研究的成败。但没有完美的数据,对于那些因为某些原因遗失的数据,即缺失值
[关键词] 缺失值 处理 [中图分类号] B841
心理学至成立以来一直致力于改善人们的生活,提高人们的生活质量,为社会的发展与进步贡献自己的绵薄之力。由于心理学是一门讲求实证的学科,要达到这样的目的,一定的研究则必不可少,这就不可避免的会遇到数据分析的问题。一个研究的成败取决于这个研究所收集数据的质量,质量较好的数据,即较少出现遗失、奇异、极端等情况,就能够反应研究的真实情况从而得到较好的研究结果。心理学是一门对人的行为进行研究的学科,然而对某些行为的研究可能会引起人们的抵触,这种抵触心理就会反映在数据的收集上,导致数据会出现一些问题,例如出现数据遗失,而怎样应对这种问题即是本文关注的焦点。
1 缺失值的概念及产生因素
缺失值指的是某项研究的某个项目或多个项目上的数据出现遗失的情况。在心理学研究中,出现缺失值是十分常见的现象,有些研究人员并没有对这个问题予以重视,往往将其忽略并简单处理了事,然而这个不受重视的问题有时会对研究结果产生致命的影响。在某些心理学研究中,由于研究经费或是社会伦理性等原因,可能研究收集的数据较少,这就导致每个数据对研究人员来说都弥足珍贵,并且由于样本量较小,一个数据的变化可能就会影响整个研究的结果。在这种情况下如果出现了缺失值,不当的处理方式将会带来严重的结果,千里大堤溃于蚁穴。
缺失值对心理学研究可能会产生如此之大的危害,那么缺失值又是如何产生的呢?
1.1被试因素
一个心理学的研究,被试自身的态度对研究结果有着至关重要的影响。例如,在某些心理学研究中由于涉及一些比较敏感的信息,被试在完成这样的研究时可能基于对自我的保护,并不会认真的完成调查或干脆不予配合,这就导致了缺失值的出现。其次,由于社会赞许等现象的存在,被试也会不按真实的情况如实完成研究,有时在问卷调查中因没有符合自己要求的答案而弃选,从而造成缺失值的出现。最后,也有可能是被试在作答时确实是因为对题目的遗漏而导致没有作答。
1.2 研究本身因素
由于心理学属于社会学科,在其进行的研究中,并不是每个研究的设计都完美无缺,特别是有些不是很严谨的问卷调查研究,问卷本身设计的不恰当,就已经对研究的结果的可信性埋下了隐患。例如:问卷题目设计的不严谨,使被试在进行作答时感觉到疑惑,从而没有作答。其次,问卷内容过多,题目过长,这都会使被试产生疲倦感,促使他们应付了事或者直接跳跃式作答。最后,对于实验研究来说,实验仪器的故障也是导致缺失值的因素之一。
1.3 主试因素
在心理学研究中,主试起到的是一个引导的作用,虽然不是被研究者,但是其本身所具有的属性,也会对研究结果产生影响。一个严格的心理学研究必须要包括对主试的培训过程,即让主试熟悉研究目的,研究注意事项等等,然而有些研究因为经费、时间等原因并没有重视这一步骤,从而导致主试缺乏一些基本的问题应对技巧,不能够在研究过程中发现问题,或是在被试出现问题时没有及时纠正。其次,在数据录入时,由于主试的粗心,导致在录入时出现错录、漏录等现象。最后,主试对于数据分析软件的操作不当也会导致数据的丢失。以上这些因素都可能会产生缺失值从而对研究产生负面影响。
2 常见的缺失值处理方法
倘若在研究中已经无可避免的出现了数据的缺失,则必须采用一些办法来填补这些缺失值,减小其对研究结果的影响。常见的处理方法有以下几种:
2.1 个案剔除法(Listwise Deletion)
该方法是最常见也最简单的缺失值处理方法,在很多统计软件(例如:SPSS)中该方法作为默认的处理方法。该方法的处理思路是,如果在研究的某一变量上存在数据缺失,则将该被试的所有数据从统计分析中删除。当缺失值的数量占数据总数量的比例没有超过20%时,使用这种方法可以很好地解决数据缺失的问题。然而在某些研究中,研究所取得的数据量很小,如果出现缺失值,使用剔除法进行处理,由于该方法的特点,势必会再次减少样本的容量,这样就会严重影响数据的客观性与准确性。同时,当数据是非随机分布时,使用这种方法会导致数据发生偏离,使最终的数据分析产生错误的结论。其次,由于被试某一变量存在缺失值而剔除该被试所有的数据,这会造成资源的大量浪费,很可能丢失了隐藏在其中的重要信息。
2.2 均值替换法(Mean Imputation)
与个案剔除法不同的是,均值替换法不需要删除被试的数据,这样就保留了与缺失变量无关的其他变量的信息,最大程度上的保证了数据的真实性与完整性。在心理学研究中,我们将变量的属性分为数值型与非数值型,对于不同类型的变量缺失值,使用不同的替
文档评论(0)