- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
测量标准误
教學評量 測驗的信度 歐慧敏 信度的意義與原理信度的意義與特性 信度的意義 測量的一致性:相同的人在不同的時間,以相同的測驗測量,或以複本測驗(相等的試題)測量,或在不同的情境下測量,所得結果的一致性。 測量的誤差性:指測驗或測驗的分數反映出真實量數的程度;即信度在於估計測量的誤差有多少。 信度的特性 心理測驗與教育測驗的信度比自然測驗的信度為低。其原因: 自然科學採直接測量,但心理與教育只能採間接測量。 自然科學使用的測量工具精確性相當高 自然科學測量的特徵相當穩定 信度不是一種普遍的特質,測驗分數不可能在任何情境下都是可靠或一致的。 各種不同的信度,代表某種特殊類型的一致性或可靠性,故信度的考慮需是測驗的用途而定。 如欲瞭解學生未來的智力發展,測驗的穩定性就非常重要。 如欲瞭解創造能力測驗分數的可靠性,即需考慮測驗分數在評分上的一致性。 信度是一種統計的概念,採用邏輯的分析,無法提供信度有效的證據。確定測驗信度主要有兩種方法: 採用相同的測驗重複測量單一受試者很多次,分析受試者本身的內在差異,這個差異通常用測量標準誤表示。 使用相同的測驗測量一群受試者兩次,根據分數在團體中的相對位置,分析受試者相互間的變異量,用來表示此變異情形的是相關係數。 使用第一種方法時,實際上不可能重複測量一個人很多次,故無法直接得到受試者內的變異,而只能利用團體資料,從受試者間相互的變異加以估計。 第二種方法教育與心理測驗信度最常用的方法。 測驗的信度愈高愈好(0 信度 1) 信度指測驗的分數或結果,而非指測驗本身。 信度的原理 真實分數與測量誤差 X=T+E X:實得分數 T:真實分數 E:誤差分數 實得分數為測驗中所得到的分數 真實分數又稱普遍性分數,其無法正確被測量到。 誤差分數表測量誤差,為個人實得分數與真實分數之差。 測量誤差可分為下列兩種: 非系統誤差(來自隨機因素) 系統誤差 真實分數與信度 S2x=S2t+S2e S2x:實得分數的總變異量 S2t :真實分數的變異量 S2e :測量誤差的變異量 相關係數 信度的類型估計信度的方法 重測法 採同一個測驗在不同的時間,重複測量相同的一群受試者兩次,根據這兩次分數求得的相關,稱為重測信度係數或稱再測信度。 此係數可表明測驗結果經過一段時間的穩定性,故又稱穩定係數。 造成重測信度係數非系統變異誤差的原因: 受試者本身情況的改變 測驗情境的改變 主試者的影響(重測的主試者要一樣) 主、受試者的交互作用 再測信度的高低與兩次間隔時間的長短有密切關係: 間隔時間愈長,信度愈低;間隔時間愈短,信度愈高。 解釋重測信度時宜將兩次間隔時間列入考慮重要因素。 測驗年齡幼小的兒童,其間隔時間要比年齡大的短。 較適用於動作與人格測驗,不適用於認知測驗。 重測信度的優點: 施測方便 可作為預測的參考 重測信度的缺點: 易受記憶的影響 重複作答,亦引起厭煩 特殊的考試不能用 兩次情境很難相同 複本方法 複本測驗:兩份測驗在內容、型式、題數、難度、指導說明、時間限制與例題等方面,必須相似或相等。 複本信度:兩個複本測驗實施於一群相同的受試者,依據所測量到的分數求相關。 實施兩個複本測驗的方式有兩種: 在同一時間連續實施:可反映出測驗工具的所造成的誤差,但無法反映出受試者本身狀況所造成的誤差,故又稱等值係數。 間隔一段時間實施:可反映出測驗工具的所造成的誤差,又可反映出受試者本身狀況所造成的誤差,故又稱穩定與等值係數。 複本方法的優點: 可同時反映出測驗內容與時間所導致的誤差,故為估計測驗信度的最好方法。 不受情境的干擾 適合追蹤研究 減少作弊、應付測驗所做的訓練 複本方法的缺點: 複本測驗的編製不易,不但費時,而且成本高 易受練習影響測量行為 作答的動機亦會減弱 內部一致性方法 折半方法 庫李方法 α係數 霍意特變異數分析法 折半方法 憑一次測驗結果,求兩半分數的相關,故其信度係數有時被稱為內部一致性係數。 最常用的兩種方法: 依照隨機方法將題目分為兩半 依照奇數題和偶數題分為兩半 在其他條件相等情況下,測驗愈長(題數愈多),其可靠性愈高,故半個測驗的信度比原來整個測驗的信度要低。 折半信度愈高表示兩半測驗的測驗的內容愈一致或相等,亦即內容的取樣愈適當。 此信度僅能說明測驗的內容取樣的誤差,不能提供時間取樣的誤差。 上述公式假定兩半測驗的變異數相等。若違反此假定,會導致高估測驗的信度
原创力文档


文档评论(0)