- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
IRT在量表(測驗)編製上的應用 陳柏熹 台灣師大心輔系 大綱 IRT的概念與發展 IRT在測驗編製上的應用 IRT在電腦化適性測驗上的應用 MIRT在多向度測驗上的應用 一、IRT的概念與發展 ?j 為考生 j 的能力, bi 是試題 i 的難度, Pij是受測者答對某個題目的機率 試題反應理論(item response theory; IRT)的基本概念 試題反應理論(IRT)與古典測驗理論(CTT)比較 試題反應理論 傳統測驗理論 模式 特性 試題的作答反應模式。 不同IRT模式適用不同測驗。 測驗總分的模式。 各種測驗都使用同一套模式。 試題 參數 題目參數估計不變性。 題目參數會受到受試者能力影響 能力 量尺 能力估計不變性。 根據概似函數估計程度,理論基礎強。 可直接參照題目或發展參照標準來解釋分數 可算出等距量尺。 受試者能力受到題目特性影響。 各題目配分直接加總,缺乏理論基礎 需發展參照標準才能解釋分數。 群體為常態分布才能算出等距量尺。 信度 測量精確度(訊息量)隨著受試者能力以及所接受的題目特性而不同。 接受同一測驗的所有受試者其測量精確度(信度)都相同。 應用 編製測驗(量表)、分數等化,編製題庫、電腦化適性測驗、組合測驗 編製測驗(量表) 整體 評估 優點: 能力估計不變性、具有題目參數估計不變性、測量精準度的概念較合理、應用層面較廣。 缺點: 不易理解、能力估計與試題參數估計較麻煩,須仰賴電腦軟體來分析 優點: 模式簡單易理解,能力與試題參數容易計算。 缺點: 等測量標準誤假設不合理、應用較狹隘,受試者程度受題目特性影響、題目參數受受試者特性影響。 試題反應理論(IRT)與古典測驗理論(CTT)比較(續) 二元計分模式 Rasch模式 常見的IRT模式 二元計分模式 二參數模式 二元計分模式 三參數模式 多元計分模式 部份給分模式 多元計分模式 評定量尺模式 單向度 測驗中的所有題目主要都是測量相同的某一項特質,或是受試者在測驗題目上的答題反應主要是受到單一項特質所影響 。 局部獨立性 相同能力水準的受試者,在各個題目上的答對機率是互相獨立的。 IRT的基本假設 評量系統公司 當代IRT的發展 向度 數量 計分 方式 參數個數 模式提出者 適用軟體 單向度 二元 計分 單參數模式 (Rasch模式) Rasch(1960) Bigstep, BILOG, BILOG-MG 二參數模式 Lord(1952) 三參數模式 Birnbaum(1968) 多元 計分 類別反應模式 (nominal response model) Bock(1972) MULTILOG, ConQuest 等級反應模式 (grade response model) Samejima(1969) 部份給分模式 (partial credit model) Wright Masters(1982) 評定量尺模式 (rating scale model) Andrich (1978) 多向度 二元 計分 多向度二參數模式 Mckinley Reckase(1983) NOHARM, ConQuest 多向度三參數模式 Hattie(1981) 多元 計分 多元計分模式 Adams, Wilson Wang, (1997) 編製測驗(量表) 測驗等化 建立題庫 組合測驗 電腦化適性測驗 IRT的應用 二、IRT在測驗編製上的應用 測驗(量表)設計原理 優良測驗設計(Best Test Design)(Wright Stone, 1979) 測量的概念 要具有可以測量的潛在特質 欲測量的特質必須是單向度 能設計出測量不同程度特質的題目,並適當安排 受測者的答題反應必須是合理的 分數量尺應該要符合等距的特性 每天都有用不完的能量 常做激烈運動還能活力十足 身體功能正常,不影響日常生活 從事簡單的活動(散步)後不會累 沒有臥病在床 休息與睡眠功能正常 有辦法從事簡單的運動,如慢跑 甲受試者 乙受試者 測量的單向度概念: 甲受試者 乙受試者 甲受試者 乙受試者 甲受試者 乙受試者 低程度題目 高程度題目 高程度題目 高程度題目 低程度題目 低程度題目 0分 8分 4分 5分 2分 5分 選擇模式 計分或估計能力時,是否要對題目進行加權? 對量尺特性的要求。 希望獲得的試題參數類型。 根據量尺特性或測驗分析的目的來決定。 資料與模式的符合度的比較。 估計受試者程度值 反應概似函數(likelihood function) 例如:在難度為(-1, -0.5, 0, 1, 2)的題目答出[1,1,0,1,0]時 尋找最佳解的方法: 最大概
您可能关注的文档
最近下载
- 劳动合同书 电子版.docx VIP
- 《运动损伤与康复》王国祥 7第七章 手腕部运动损伤与康复.ppt VIP
- 部编版二年级道德与法治上册第8课《我为班级作贡献》精美课件.pptx VIP
- 法考十年客观题分科真题-民法.pdf VIP
- 北京市五年(2021-2025)高考英语真题分类汇编:专题12 阅读理解七选五(原卷版).pdf VIP
- 2023北京十四中初一(上)期中数学(含答案).pdf VIP
- UG CAD理论题库3.doc VIP
- 斗提机施工方案.doc VIP
- DB11_T2154-2023_城市轨道交通工程浅埋暗挖法施工技术规程_北京市.pdf VIP
- 支气管动脉栓塞术治疗咯血操作规程专家共识解读PPT课件.pptx VIP
原创力文档


文档评论(0)