测验的信度及效度.pptVIP

下载本文档

4
0
约4.99千字
约 50页
2018-07-04 发布于湖北
举报
版权申诉

测验的信度及效度.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

測驗的信度與效度陳振明信度與效度以打靶為例信度(reliability) 測驗資料的可靠性效度(validity) 測驗結果的真確性信度信度的意義測量的一致性(就內容而言)或穩定性(就時間而言)，幾次測驗結果是否一致的程度範例一天之內以同一磅秤多次測量某人體重結果一：大致相同→測量結果可靠結果二：有顯著性的差異→測量結果不可靠信度並非「全有或全無」，而是程度的問題。若多次重複測量的結果都非常接近，則說明該評量結果信度高;反之，若各次評量結果的變異大，則信度低。與物質、生理特徵的測量相較，心理測驗的測量精確度較低。誤差來源個人狀況(身體不適、大意) 題目本身的合宜性(太難、太容易) 測驗情境的影響(實施、計分的錯誤) 信度的原理實得分數與真正分數實得分數(X)=真正分數(T)+誤差分數(E) 實得分數變異數(S2X)=真正分數變異數( S2T)+誤差分數變異數(S2E ) 信度變異= S2T/ S2X 信度的類型信度的類型再測信度（test-retest reliability）係指以同一種測量工具，對同一群受試者，前後測驗兩次的相關係數。又稱穩定係數。通常時間越長，再測信度越低常見於：智力、性向、人格等測驗通常個別化診斷測驗信度係數須達.90，團體測驗為.80，篩選測驗為.60 優缺點？信度的類型複本信度（a1ternate-form reliability）同一群受試者接受兩種複本測驗的得分之相關係數。複本常見於團體化測驗，可相互替代使用(例如前後測)，使用便利複本測驗需要在內容、型式、題數、難度、測驗指導與時間等都需要與原測驗相等，主要誤差來源：內容取樣、時間間隔、練習效果、學習遷移優缺點？信度的類型內部一致性係數（coefficient of internal consistency）反映測量工具內部同質性、一致性或穩定度。同質性越高，代表量表試題是在測量相同的特質。常用方法有：方法庫李(KR20)(1937)適用於二分變數(對錯)的測量 Cronbach’s α(1951)適用於多元尺度變數(多元計分)的測量折半信度（split-half reliability）：測驗題目依題目的單雙數或其他方法分成兩半，計算受測者在兩半測驗上的分數的相關係數。優缺點？信度的類型評分者間信度(inter-rater reliability)：不同的評量者的觀察、紀錄、評分的一致性。傳統：相關係數、同意百分比法近代：類推性理論影響信度的因素影響信度的關鍵因素是測量誤差，可以減低誤差的方法，即能夠提高信度。基本原理：中央極限定理、測量標準誤、共變量的計算影響信度的因素受試者因素（如受測者的身心健康狀況、動機、注意力、持久性、作答態度等變動）主試者因素（如非標準化的測驗程序、主試者的偏頗與暗示、評分的主觀性等等）測驗情境因素（測驗環境條件如通風、光線、聲音、桌面、空間因素等皆有影響的作用）測驗內容因素（試題取樣不當、內部一致性低、題數過少等）時間因素效度效度的意義效度的意義測量的正確性，指測驗或其他測量工具確能測得其所欲測量的特質或功能之程度測量的效度愈高，表示測量的結果愈能顯現其所欲測量對象的真正特徵評估效度的方法判斷法（informed judgment）測量特性與質的評估實徵法（gathering of empirical evidence）根據具體客觀的量化指標來進行評估效度的類型內容效度（content validity）效標關聯效度（criterion-related validity）建構效度（construct validity）內容效度（content validity）內容效度反映測量工具本身內容廣度的適切程度，強調測量內容(教材內容或預期的行為)的廣度、涵蓋性與豐富性，以做為外在推論的主要依據。針對測量工具的目標和內容，以系統的邏輯方法來詳細分析，又稱為邏輯效度（1ogical validity）表面效度（face validity），指測量工具在外顯形式上的有效程度限制：出於邏輯判斷，缺乏實證的統計數據評估指標，需以判斷法來進行效度評估內容效度的判斷方式專家效度雙向細目表表格左方表示教學所欲達成的目標，上方表示教材內容範圍，並逐一檢視每一試題以考驗整份測驗之內容效度雙向細目表提高內容效度的方法列出教材內容各項重點與所要測量的學習結果或行為各項教材重點和學習結果要以相對的重要性來加權依據雙向細目表來編製測驗，所編製的測驗越符合細目表各細格所佔的比重，則內容效度越高。效標關聯效度意義（criterion-r