- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
测验的概念与编制程序
測驗的概念與編製程序
陳柏熹
國民中學學生基本學力測驗推動工作委員會
壹、前言
一、測量的概念
測驗的概念始於測量,其目的主要是在了解個體在某一項心理特質(例如:數學能力,美術性向或內、外向傾向…等)上的狀況。其做法是設計一些能夠測量出該項特質的題目讓受試者去回答,經由受試者的答題反應來估計他在該項特質上的程度,並給予分數描述之。為了使所給予的分數能夠真實的反映出個體在該項心理特質上的程度,有幾個要件必須要先具備(Wright Stone, 1979; 陳柏熹,王文中,民88):
第一個要件是單向度,這是指該測驗中所有題目都應當是在測量所欲測量的特質,不應該有題目是在測量其它的特質。因為只有如此,這些題目的分數相加才有意義。要了解這個概念,我們可以試著想想看以下的情況:假設我們編製一個測驗包含兩個題目,一個題目問受試者的身高,另一個題目試問受試者的體重。當我們把受試者在這兩個題目上的反應相加時,它究竟代表了什麼意義?這個問題是很難回答的。除非我們能有理論說明身高與體重的加總代表著一個人的某項特質,或能夠預測某種行為,否則把這兩種測量不同特質的反應相加是毫無意義的。要使測驗的分數真的能夠反應出受試者在某項心理特質上的程度,在題目設計時,最基本的要求是「測驗中的每個題目主要都是在測量我們所想要測量的特質」;也唯有如此,受試者在這些題目上的答題反應才能加總形成一個有意義的分數。
除了題目必須符合單項度的要求外,受試者的反應也應當是可以被預測的。當題目都是測量同一項特質時,我們可以根據每個題目所測到的特質程度高低給予排列。一般而言,如果受試者能夠答對高難度的題目(或對較高程度的題目回答出正向反應),我們會預期他應該有能夠答對簡單的題目(或對低程度的題目回答出正向反應),如圖一所示。此時我們才能給予分數,並宣稱此人的程度是在a的位置。如果受試者的反應並不如預期,他答對了高難度的題目,卻反而答錯了簡單的題目,如圖二所示。此時表示測量失敗,我們應當重新去檢討測驗題目的設計是否有問題,並去了解受試者是否有亂作答的情形。
低能力受測者 a 高能力受測者
+ + + + + + + + - - -
容易的題目 困難的題目
圖一 良好測量的受試者反應模式(+表示答對,-表示答錯)
無法了解受試者能力 ? ? ? ? ?
- + - - - + - + + - +
容易的題目 困難的題目
圖二 測量失敗的受試者反應模式(+表示答對,-表示答錯)
第三個要件是所提供的分數必須是等距(interval)的分數。由於許多群體或個體間的比較所使用的統計方法都是建立在等距分數的基礎上,因此等距量尺也是測量應具備的要件。也只有當分數是等距的時候,才適合拿來進行加減、乘除等運算。如果分數不是等距的,則進行運算時意義也是很模糊的。例如,當我們把第八名與第六名兩者相加,我們很難說明相加後的數字「14」究竟代表什麼意義,是第十四名嗎?還是其他的意義。這是因為名次僅具有等級的概念,不具有等距的概念。
如果要將題目形成一份測驗,為了提高測驗的效率,題目難度還要依測驗目的作適當的分布。由於受試者很難面對一份測驗好幾的小時而不感到疲倦,為了減少疲勞因素的干擾,測驗的作答時間通常不會超過一個小時,所以也必須限制題數。在題數有限的條件下,為了降低測量的誤差,題目的難度就必須依據測驗的目的作適當的分布。如果測驗的目的是要篩選資優生,則高難度的題目數量就要增加,如此才能增加高能力受試者的測量精確度。但是如果測驗的目的是要對廣大的母群體作測量,並希望增加大多數人的測量精確性,則題目難度應該分布廣泛些,並且可以稍微多一些中等難度的題目(因為中等能力的人通常比較多)。
當上述這些條件符合了,我們才能宣稱測量已經開始了,基於這些條件所建立的分數才是比較具有意義的分數。不過上述這些只是測量的要件,要成為一份良好的測驗,還必須具備測驗的幾個要素。分別陳述於下一節中。
二、測驗的要素(周文欽等,民84)
1.信度
信度(reliability)指測驗分數的穩定性與可靠性。穩定性是指同一份測驗經過不同時間的多次施測,所得分數沒有太大的差異;一致性是指測驗題目都是在測量同一特質,與上一節中單向度的概念相近。就統計上而言,信度是測量分數的變異量中,真實分數變異量所佔的比例。也因此大多數信度的計算方式都是建立測這個概念之上。
信度的指標有許多種,以下分別敘述幾種常見的指標:一種是再測信度 (test-retest reliability),是計算同一群體,用同一份測驗進行兩次施測其分數的相關係數。這是為了了解測驗分數的穩定性或測驗時間取樣的誤差。第二種是折半信度(split-half reliability),是將一份測驗拆成對等的兩半,計算這兩半總分之間的相關係數
您可能关注的文档
- 构建和谐包容的和包生态链-gsma.pdf
- 某复杂体型高层建筑模型结构振动台试验研究.pdf
- 条约法上的善意原则-中国法学网.pdf
- 某事业单位使劳工从事.pdf
- 某工程脚手架施工组织-移动脚手架.doc
- 某某lpg气化站管理制度汇编.pdf
- 某工程双排扣件式钢管落地架施工方案-建筑施工组织设计大全10g.doc
- 某轮木匠被理货间水密门压伤三指-上海远洋对外劳务有限公司.doc
- 柬埔寨道路桥梁epc项目的设计优化管理-上海建筑施工行业协会.pdf
- 某风电场风电机组地基基础方案比选研究-电网与清洁能源.pdf
- 初中英语人教版七年级上册第四单元Where is my schoolbag ! Section A .ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.ppt
- 初中英语人教版七年级下册 Unit 6 I'm watching TV. Section A 11a.pptx
- 注册土木工程师培训课件.ppt
- 初中生物济南版七年级上册第一章奇妙的生命现象 第三节生物学的探究方法.ppt
- 初中英语人教版七年级上册第四单元Where is my schoolbag Section B 2.pptx
- 注册安全工程师案例课件.ppt
- 初中物理人教版八年级上册第二章第4节噪声的危害和控制课件(共19张PPT).pptx
- 注册安全工程师王阳课件.ppt
- 初中数学青岛版八年级上2.4《线段的垂直平分线》课件(16张PPT).ppt
原创力文档


文档评论(0)