IRT在量表(测验)编制上的应用 .pptVIP

下载本文档

6
0
约2.41千字
约 24页
2019-07-13 发布于广东
举报
版权申诉

IRT在量表(测验)编制上的应用 .ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

IRT在量表(測驗)編製上的應用陳柏熹台灣師大心輔系大綱 IRT的概念與發展 IRT在測驗編製上的應用 IRT在電腦化適性測驗上的應用 MIRT在多向度測驗上的應用一、IRT的概念與發展 ?j 為考生 j 的能力， bi 是試題 i 的難度， Pij是受測者答對某個題目的機率試題反應理論(item response theory; IRT)的基本概念試題反應理論(IRT)與古典測驗理論(CTT)比較試題反應理論傳統測驗理論模式特性試題的作答反應模式。不同IRT模式適用不同測驗。測驗總分的模式。各種測驗都使用同一套模式。試題參數題目參數估計不變性。題目參數會受到受試者能力影響能力量尺能力估計不變性。根據概似函數估計程度，理論基礎強。可直接參照題目或發展參照標準來解釋分數可算出等距量尺。受試者能力受到題目特性影響。各題目配分直接加總，缺乏理論基礎需發展參照標準才能解釋分數。群體為常態分布才能算出等距量尺。信度測量精確度(訊息量)隨著受試者能力以及所接受的題目特性而不同。接受同一測驗的所有受試者其測量精確度(信度)都相同。應用編製測驗(量表)、分數等化，編製題庫、電腦化適性測驗、組合測驗編製測驗(量表) 整體評估優點：能力估計不變性、具有題目參數估計不變性、測量精準度的概念較合理、應用層面較廣。缺點：不易理解、能力估計與試題參數估計較麻煩，須仰賴電腦軟體來分析優點：模式簡單易理解，能力與試題參數容易計算。缺點：等測量標準誤假設不合理、應用較狹隘，受試者程度受題目特性影響、題目參數受受試者特性影響。試題反應理論(IRT)與古典測驗理論(CTT)比較(續) 二元計分模式 Rasch模式常見的IRT模式二元計分模式二參數模式二元計分模式三參數模式多元計分模式部份給分模式多元計分模式評定量尺模式單向度測驗中的所有題目主要都是測量相同的某一項特質，或是受試者在測驗題目上的答題反應主要是受到單一項特質所影響。局部獨立性相同能力水準的受試者，在各個題目上的答對機率是互相獨立的。 IRT的基本假設評量系統公司當代IRT的發展向度數量計分方式參數個數模式提出者適用軟體單向度二元計分單參數模式 (Rasch模式) Rasch(1960) Bigstep, BILOG, BILOG-MG 二參數模式 Lord(1952) 三參數模式 Birnbaum(1968) 多元計分類別反應模式 (nominal response model) Bock(1972) MULTILOG, ConQuest 等級反應模式 (grade response model) Samejima(1969) 部份給分模式 (partial credit model) Wright Masters(1982) 評定量尺模式 (rating scale model) Andrich (1978) 多向度二元計分多向度二參數模式 Mckinley Reckase(1983) NOHARM, ConQuest 多向度三參數模式 Hattie(1981) 多元計分多元計分模式 Adams, Wilson Wang, (1997) 編製測驗(量表) 測驗等化建立題庫組合測驗電腦化適性測驗 IRT的應用二、IRT在測驗編製上的應用測驗(量表)設計原理優良測驗設計(Best Test Design)(Wright Stone, 1979) 測量的概念要具有可以測量的潛在特質欲測量的特質必須是單向度能設計出測量不同程度特質的題目，並適當安排受測者的答題反應必須是合理的分數量尺應該要符合等距的特性每天都有用不完的能量常做激烈運動還能活力十足身體功能正常，不影響日常生活從事簡單的活動(散步)後不會累沒有臥病在床休息與睡眠功能正常有辦法從事簡單的運動，如慢跑甲受試者乙受試者測量的單向度概念：甲受試者乙受試者甲受試者乙受試者甲受試者乙受試者低程度題目高程度題目高程度題目高程度題目低程度題目低程度題目 0分 8分 4分 5分 2分 5分選擇模式計分或估計能力時，是否要對題目進行加權？對量尺特性的要求。希望獲得的試題參數類型。根據量尺特性或測驗分析的目的來決定。資料與模式的符合度的比較。估計受試者程度值反應概似函數（likelihood function）例如：在難度為(-1, -0.5, 0, 1, 2)的題目答出[1,1,0,1,0]時尋找最佳解的方法：最大概