资料整理与检核.docVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社會研究方法 關秉寅 資料整理與檢核 資料經調查蒐集後,必須整理為某種型式,以供電腦分析。這個工作可分為四個步驟: 決定格式:將資料編為檔案的方法。 編碼(coding):編予受訪者所提供之答案一個相對應數值的規則。 資料登錄輸入:將資料鍵入卡片、磁帶、磁片等,以工具分析功能的軟體閱讀。 資料檢核:分析之前,進行檔案檢查工作,以確保其準確、完整及一致性。 資料檔案格式化 每種統計分析套裝軟體對於資料格式化的要求不同。因此,研究者在整理資料時決定使用何種程式來分析資料,並根據其要求之資料格式來做編碼與登錄輸入的動作。雖然依程式有不同格式化的規則,但通常的原則是每個受訪者對各題項的回答應按照順序編碼,且每個受訪者的資料有相同的資料列數,並登錄在相同的欄位上。 編碼 將問卷中每個問題的每一項答案給予一個對等的代表數字,就稱之為編碼。通常這項工作在製作問卷的內容時,大部分編碼的動作已經確定了。編碼的過程也常與問題陳述方法、格式,及問卷整體格式等有關。這些都是在問卷付印前就需要決定的。例如,將數字代碼編製在每個答案選項前,且在設計每個題項時,給予適當位置來填寫對應答案選項的代碼的話,就可在問卷收回後,很快的將此數字代碼轉換成電腦統計程式可以判讀的資料。再賦予各個答案選項數字代碼時,建議依照以下的慣例,以期使後續資料輸入的效率及正確性能達到最高的程度。 開始編碼時,應先給予每個問項所代表的變項一個變項名稱。除此以外,研究者會因需要而創造一些非問卷題項的變項。例如,有時因為抽樣設計的程序,研究者會將抽樣叢集(sampling clusters)變成變項。此外,要記得給每一個受訪者自己的ID。 對各答項進行編號時,應該要以遞升或遞減的排列順序,讓代碼數值保持一致性。如果在題項設計時,是以答項代碼數值小的來代表最高的程度,則在編碼時,可以考慮用反向的數值來編碼,以反應實質的涵義。但也可繼續以原先的代碼來編碼,然後在資料分析階段再做處理。這種作法,比較簡單易行,不容易出錯。 當答項超過九個時,或你認為稍後還有可能增加某些選項時,就應該使用兩位數的代碼,如01、02……10、11。 即使在答案中無「不知道」的選項,你還是要保留一個代碼數值以備不時之需。因為常有受訪者會自行寫上這種答案。用來代表「不知道」的代碼數值在編碼時應該一致。如通常是以「8」來代表。如果是兩位數的代碼則以「98」來代表,以此類推。 另外,也要以一致的數值來代表那些原本應該要有答案,但卻缺漏或未做說明的情況,也就是一般所稱的「遺漏值」(missing values)。通常是以「9」或「99」來代表。 對於您指示受訪者可以略過的題項(即跳答的情況),也需以固定的代碼來表示。注意,正常跳答的狀況並不是遺漏,因此通常是以「0」來代表。 當答案選項可以複選時,通常是將每一答項視為一個變項,其代碼則是以「0」及「1」來代表是否有人勾選此答案選項。 資料輸入 各種資料輸入方式: 雇用編碼者(coders)審視回收問卷中的所有答案,將每個答案代碼轉換到編碼表上,然後再找人輸入電腦中。比較先進的作法是將編碼後的資料,直接輸入電腦中。 標準式的測驗,如大學學測,則可將一一畫記的感應線條,以光學感應的方式掃讀後,輸出對應答案的代碼資料。這種方式在大量問卷調查時頗為經濟,但其設備及維護的成本也高。 資料的檢誤核對:不論是哪種方式將資料輸入,在資料輸入及分析前,都要先經過檢誤核對及校訂的過程。 資料輸入前:有些受訪者可能並未回答某些應要作答的問題,有些則為勾選提供的答案選項,而自行在空白處寫上自己的意見,而有些則在要求單選的題項做複選等。這些問題在資料輸入前,都應做適當的過濾、處理與編碼。如果問卷中有開放式問項,則也通常在資料輸入前,就將這類問項的答案分類並給予數字代碼。 資料輸入的前置作業中最重要的工作是建立一套品管制度,以減低編碼及輸入過程中要做決定時可能出現的錯誤。建立這套制度的第一個步驟是在進行校訂及編碼過程前,就要訂出一套明確的書面指示及編碼規則。除此以外,要確定指派的「校訂者」及「編碼者」在執行工作時所做的決定,是依照既定的規則與指示進行。研究者可另派人從每位編碼者完成的工作中,以隨機抽樣樣本方式進行獨立檢視或編碼的作業,並比對兩者間是否有差異。如果有差異的話,除了粗心外,也可能是制定的編碼規則有不周全或不適當之處。 資料檢誤與過濾:在開始進行資料分析前,通常還需要對所有的資料做兩種核對的工作: 首先要檢核的是「不合理值」的情況,亦即資料中是否有任何超過設定範圍的答案出現。例如,某題只有1至5等五個答案代碼,如果出現大於5或小於1的情況,就要將原來的問卷調出,核對真正的答案為何。 其次要檢核答案的「一致性」。有時受訪者對某個特定問題的回答應視其對先前問題的回答而定。例如,受訪者對婚姻狀態之題

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档