量表之考量.pptVIP

下载本文档

10
0
约3.29千字
约 38页
2018-06-16 发布于浙江
举报
版权申诉

量表之考量.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

量表之考量

第四章正式評量應具備的測驗認知? 第一節效度效度（validity）乃是評量工具的成效，是測驗最為重要的技術性特色。基本上效度是關心「測驗所欲測量的內容到底有多好？」或「測驗能測量到所欲測量的範圍嗎？」。在探討評量工具上包括下列三種主要的測驗效度型式：一.內容效度「內容效度」（content validity）係指測驗正確地測量行為樣本的範圍。擁有良好內容效度的測驗，包括範圍或學習領域上具有代表性的行為樣本。至於建立內容效度可以包括下列幾項步驟：? 步驟一：依據完整的內容領域評論來發展測驗細目步驟二：編製測驗項目以求符合測驗項目步驟三：針對仔細選擇的一組對象進行預試步驟四：根據預試結果來修正測驗項目] 步驟五：編製成最後的測驗表面效度是一種非技術性的效度型式，包括快速評論測驗以決定其在表面上是否有效的程度。現金效度關心的是商業性測驗的銷售量。二.效標關聯效度「效標關聯效度」（criterion-related validity）係指個人在某測驗的分數與一項標準測量的關聯（通常是個人在另一項測驗上的分數）此種比較所產生的相關係數稱為效度係數。它們的範圍由-1.00（完全負相關）至1.00（完全正相關）。「效標關聯效度」包含「預測效度」--測量測驗在預測未來成就表現上的成效和「同時效度」--測驗與另一可供比較的測驗或其他已具有效度測量的相關。三.構念效度「構念效度」（construct validity）要比其他型式的信度更為抽象，它是指測驗測量理論性構念或概念多好的程度。智力、自我概念、粗大動作能力和推理能力是幾種難以界定和測量的抽象構念。通常構念效度的建立包括仔細的鑑定和界定構念，然後引出和驗證有關構念的測驗成就表現的假設。由於建立構念效度需要較長的歷程，大多數測驗很少提供此種效度型式的資料。除多數非正式測驗外，都提供有關兩種其他效度型式（內容和效標關聯）的資料。使一種測驗有效的歷程是無法與決定測驗信度的歷程分開來的事實上，這兩種測驗概念之間存在令人驚訝的關係可以是可靠但是沒有效度的，但是不可能有效度卻沒有信度。? 第二節信度「信度」（reliability）乃是評量工具的必要技術性品質，它是指測驗分數和其它學生能力和行為的正確性與一致性。表示信度統計的是信度係數（reliability coefficient, r），它包括由0至1的數值。r =0表示完全無信度可言，而r =1則代表完美的信度。一.重測信度「重測信度」（test-retest reliability ）乃是一種估計正確性的歷程，包括針對仔細選擇的一組對象施予兩次測驗，並使用所得分數來計算信度係數，以描述這兩組分數間的一致性。二.複本信度「複本信度」（alternate-form reliability）又稱為等量信度（equivalent-form reliability），也可稱作互替形式97的108信度，它是一種比較同一測驗兩種型式的分數，來估計其正確性的過程。三.折半信度「折半信度」（split-half reliability）是一種決定正確性的程序，包括同一測驗兩個部分的相關。也就是說，將測驗項目分成兩半，並比較這兩半測驗項目的相關係數。測量標準誤（stardard error of measurement, SEM）代表企圖說明可能的變異性或測驗計分和解釋上所涉及的錯誤。測驗的信度愈大，SEM就會愈小。四.評分者間信度「評分者間信度」（inter-rater reliability）通常是指觀察者間信度（inter-observer reliability），有時又稱為計分者間信度（Interscorer reliability）。它關心測驗如何計分一致或由兩位評分者者評定行為。第三節常模測驗常模是由常模組上的受試分數所發展出來的一組分數，是用來解釋測驗分數的依據。任何測驗的原始分數，若無法對照常模就難以看出其意義來。常模型式有多種包括全國性常模、地區性常模、特殊團體常模及學校平均數常模等。常模參照測驗的可信度取決於常模的可靠性。如果常模具有代表性，就可以產生有效的比較。反之，就會發生無效的比較。在評鑑常模的效度上 Sattler（1992）曾確定了三種要素：（1）代表性：包括年齡、年級水準、性別、地理區域和社經地位等特性。（2）大小：是指常模組上的受試數目（至少包括每各年齡或年級100名受試者）；（3）適切性：則包括關心常模的可用性。一.常模參照與標準參照測驗