教育測(cè)量與評(píng)價(jià)-測(cè)量指標(biāo).ppt
《教育測(cè)量與評(píng)價(jià)-測(cè)量指標(biāo).ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《教育測(cè)量與評(píng)價(jià)-測(cè)量指標(biāo).ppt(66頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、教育測(cè)量與評(píng)價(jià),——測(cè)量的質(zhì)量指標(biāo),教育測(cè)量的質(zhì)量指標(biāo),衡量教育測(cè)量的質(zhì)量,可采用四個(gè)指標(biāo):信度主要對(duì)整個(gè)測(cè)量而言。效度難度主要對(duì)測(cè)量的項(xiàng)目而言。區(qū)分度,,,一、信度概述,(一)什么是信度信度是指測(cè)量結(jié)果的穩(wěn)定性或可靠性程度。一般地說,一個(gè)好的測(cè)量必須具有較高的信度,也就是說,一個(gè)好的測(cè)量工具,只要遵守操作規(guī)則,其結(jié)果就不應(yīng)隨工具的使用者或使用時(shí)間等方面的變化而發(fā)生較大的變化。必須從以下兩個(gè)方面去理解測(cè)量的信度:信度指實(shí)測(cè)值(X)和真值(T)相差的程度;信度指兩次重復(fù)測(cè)量或等值測(cè)量之間的關(guān)聯(lián)程度。,(二)信度的估計(jì)方法,1、重復(fù)信度(再測(cè)信度)指的是同一個(gè)量表對(duì)同一組被試施測(cè)兩次所得結(jié)果的一致
2、性程度。其大小等于同一組被試在兩次測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù),一般采用皮爾遜積差相關(guān)的公式來計(jì)算。,例一,用一個(gè)算術(shù)四則的速度測(cè)驗(yàn)12個(gè)小學(xué)生,得分記為X,為了考察測(cè)量結(jié)果的可靠性,于3個(gè)月后再測(cè)一次,得分記為Y,問測(cè)驗(yàn)結(jié)果是否可靠?學(xué)生序號(hào)123456789101112X202021222323232425262627Y202121202323252526262729,在使用重測(cè)法計(jì)算穩(wěn)定性系數(shù)時(shí),應(yīng)注意以下問題:,1、信度的取值范圍為[0,1],當(dāng)信度值較大時(shí),說明前后兩次測(cè)量結(jié)果比較一致;2、兩次測(cè)驗(yàn)之間的時(shí)間間隔要適宜。應(yīng)由測(cè)驗(yàn)的性質(zhì)、測(cè)題類型、測(cè)題數(shù)量和被試特點(diǎn)所決定;3、重測(cè)法適用于
3、速度測(cè)驗(yàn)而不適用于難度測(cè)驗(yàn);4、應(yīng)注意提高被試者的積極性。,2、復(fù)本信度,指的是兩個(gè)平等的測(cè)驗(yàn)測(cè)量同一批被試所得結(jié)果的一致性程度。其大小等于同一批被試在兩個(gè)復(fù)本測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。所謂復(fù)本測(cè)驗(yàn)是指在性質(zhì)、內(nèi)容、題型、題數(shù)、難度等方面都一致(或相等)的兩份或多份測(cè)驗(yàn)。,例二,以A、B兩型英語(yǔ)復(fù)本測(cè)驗(yàn)對(duì)初中三年級(jí)10個(gè)學(xué)生施測(cè),為避免由測(cè)驗(yàn)施測(cè)順序所造成的誤差,其中5個(gè)學(xué)生先做A型測(cè)驗(yàn),休息15分鐘后,再做B型測(cè)驗(yàn);而另5個(gè)學(xué)生先做B型測(cè)驗(yàn),休息15分鐘后,再做A型測(cè)驗(yàn)。10個(gè)學(xué)生A型測(cè)驗(yàn)結(jié)果記為X,B型測(cè)驗(yàn)結(jié)果記為Y,其測(cè)驗(yàn)的復(fù)本信度如何?學(xué)生序號(hào)12345678910X191918171
4、61515141312Y20171818171513151212,復(fù)本信度的優(yōu)缺點(diǎn)表現(xiàn):,優(yōu)點(diǎn):1、測(cè)驗(yàn)的兩個(gè)復(fù)本,如果在不同的時(shí)間使用,其信度既可以反映在不同時(shí)間的穩(wěn)定性,又可以反映對(duì)于不同測(cè)題的一致性;2、兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測(cè)信息的一些缺點(diǎn),如首測(cè)時(shí)再測(cè)在記憶、練習(xí)、效果的影響,間隔期間獲得新知識(shí)的影響,兩次施測(cè)的環(huán)境不同和被試主觀狀態(tài)不同的影響,以及為了應(yīng)付測(cè)驗(yàn)所作訓(xùn)練的影響等。,缺點(diǎn):,1、編制兩個(gè)完全相等的測(cè)驗(yàn)是很困難的,如果兩個(gè)復(fù)本過分相似,則變成再測(cè)形式,而過分不相似,又使等值的條件不存在;2、兩個(gè)復(fù)本測(cè)驗(yàn)有可能在某種程度上測(cè)量了不同的性質(zhì),這就會(huì)低估測(cè)驗(yàn)的信度;3
5、、被試同時(shí)接受性質(zhì)相似的兩個(gè)測(cè)驗(yàn),可能減少完成測(cè)驗(yàn)的積極性;4、雖然兩個(gè)復(fù)本測(cè)驗(yàn)的題目材料不同,但被試一旦掌握了解題的某一模式,就能觸類旁通,有可能失去復(fù)本的意義。,3、折半信度(分半信度),就是將測(cè)驗(yàn)分半,再求被試在每一半測(cè)驗(yàn)上所得分?jǐn)?shù)的相關(guān)系數(shù)。首先根據(jù)內(nèi)容、形式、題數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、難度、測(cè)題間相關(guān)以及分布形態(tài)相等的原則,將試題分成兩半,或者將從易到難排列的測(cè)題,按照測(cè)題序號(hào),奇數(shù)測(cè)題為一組,偶數(shù)測(cè)題為一組,分成兩半;然后計(jì)算每個(gè)被試在兩個(gè)分半測(cè)驗(yàn)分?jǐn)?shù)的積差相關(guān)系數(shù),再用斯皮爾曼—布朗公式加以校正。斯皮爾曼—布朗公式為,例三,對(duì)初中一年級(jí)學(xué)生進(jìn)行地理成績(jī)測(cè)驗(yàn),每答對(duì)1題得1分,答錯(cuò)1題
6、得0分,其測(cè)驗(yàn)結(jié)果如下表,試估計(jì)該測(cè)驗(yàn)的折半信度?學(xué)生序號(hào)題序12345611000002000100310100041100105100100611101171111018110110901100110111111,(三)提高信度的方法,1、影響測(cè)量信度的主要因素(1)被試方面(2)主試方面(3)施測(cè)情境方面(4)測(cè)量工具方面(5)兩次施測(cè)的間隔時(shí)間方面,2、提高測(cè)量信度的常用方法,(1)適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度(2)測(cè)驗(yàn)的難度要適中(3)測(cè)驗(yàn)的內(nèi)容應(yīng)盡量同質(zhì)(4)測(cè)驗(yàn)的程序應(yīng)統(tǒng)一(5)測(cè)驗(yàn)的時(shí)間要充分(6)測(cè)驗(yàn)的評(píng)分要盡量做到客觀化,減少評(píng)分誤差,二、效度的概念,(一)什么是效度效度是指測(cè)量結(jié)果
7、的準(zhǔn)確性和有效性的程度。也可以說是測(cè)量是否達(dá)到了預(yù)期的目的。1、效度是一個(gè)相對(duì)的概念。(1)測(cè)量的效度是相對(duì)一定的測(cè)量目的而言的(2)測(cè)量的效度是相對(duì)測(cè)量的結(jié)果而言的2、一種測(cè)量的效度只是高或低的問題測(cè)量結(jié)果總是有一定效度的,只是效度高低不同罷了。,(二)效度的估計(jì),效度估計(jì)就是多方尋找證據(jù)來證明一個(gè)測(cè)驗(yàn)的有效性程度的過程。1、內(nèi)容效度就是指測(cè)驗(yàn)內(nèi)容對(duì)所要測(cè)量的內(nèi)容的代表性程度。也就是說,測(cè)驗(yàn)的內(nèi)容范圍、材料與所要測(cè)量的內(nèi)容范圍、教育目標(biāo)是否相符合;測(cè)驗(yàn)中測(cè)題所引起的行為是否是所要測(cè)量的屬性的明確反應(yīng);測(cè)驗(yàn)的結(jié)果是否是一個(gè)有代表性的行為樣本。為了使測(cè)驗(yàn)的內(nèi)容具有有效性,成為所欲測(cè)量?jī)?nèi)容的一個(gè)具
8、有代表性的行為樣本,在編制測(cè)驗(yàn)時(shí),就要考慮建立內(nèi)容效度的問題。,2、內(nèi)容效度的估計(jì),(1)邏輯分析法其工作思路是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容范圍的吻合程度作出判斷。(2)統(tǒng)計(jì)分析法從同一個(gè)教學(xué)內(nèi)容總體中抽取兩套獨(dú)立的平行測(cè)驗(yàn),用這兩個(gè)測(cè)驗(yàn)來測(cè)同一批被試,求其相關(guān)。若相關(guān)高,表明測(cè)驗(yàn)內(nèi)容效度較高;若相關(guān)低,表示測(cè)驗(yàn)的內(nèi)容效度較低。采用求統(tǒng)計(jì)量的公式進(jìn)行計(jì)算,其公式有以下三種形式:,例一,在《社會(huì)發(fā)展史》某一單元教學(xué)之前,對(duì)學(xué)生進(jìn)行有關(guān)這一單元內(nèi)容的測(cè)驗(yàn)。教學(xué)之后,再以復(fù)本測(cè)驗(yàn)施測(cè),兩次測(cè)驗(yàn)分?jǐn)?shù)如下,試檢定測(cè)驗(yàn)的內(nèi)容效度?學(xué)生序號(hào)12345678910教學(xué)前X344032303135443342
9、36教學(xué)后Y52645054586372626250,結(jié)論,然后根據(jù)自由度df=N-1=9,查t值表,尋得0.01顯著性水平t的雙側(cè)臨界值為t(9)0.01=4.781,而實(shí)際計(jì)算出的[t]=13.9>74.781=t(9)0.01,于是可以說,教學(xué)前后學(xué)生在兩個(gè)復(fù)本測(cè)驗(yàn)上得分的平均數(shù)有極顯著性差異,從而可以作出判斷,《社會(huì)發(fā)展史》中該單元測(cè)驗(yàn)的內(nèi)容具有有效性,或內(nèi)容效度較高。,,內(nèi)容效度主要應(yīng)用于成就測(cè)驗(yàn)、學(xué)科測(cè)驗(yàn)、選拔和分類職業(yè)測(cè)驗(yàn)。內(nèi)容效度不適合用于能力傾向和人格測(cè)驗(yàn)。,2、結(jié)構(gòu)效度,是指測(cè)驗(yàn)對(duì)于人的心理特性或理論概念測(cè)量到的程度。通常用某種操作來定義,并用測(cè)驗(yàn)來測(cè)量。例如:人的創(chuàng)造力可
10、以分解為人的思維流暢性、靈活性和創(chuàng)造性三大特性,并根據(jù)這三大特性編制測(cè)驗(yàn),若有足夠的證據(jù)來證明該測(cè)驗(yàn)確實(shí)可以測(cè)到這些特性,則認(rèn)為該測(cè)驗(yàn)是個(gè)結(jié)構(gòu)效度較高的創(chuàng)造力測(cè)驗(yàn)。,(1)結(jié)構(gòu)效度的特點(diǎn),結(jié)構(gòu)效度的大小完全取決于事先假定的心理特質(zhì)理論,一旦人們對(duì)同一種心理特質(zhì)有著不同的定義或假設(shè),則會(huì)使得關(guān)于特質(zhì)測(cè)驗(yàn)的結(jié)構(gòu)效度的研究結(jié)果無法比較。當(dāng)實(shí)際測(cè)量的資料無法證實(shí)我們的理論假設(shè)時(shí),并不一定就表明該測(cè)驗(yàn)結(jié)構(gòu)效度高。因?yàn)檫€有可能出現(xiàn)理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z查等情況,這就使得結(jié)構(gòu)效度的獲取更為困難。,(2)建立結(jié)構(gòu)效度的步驟,A、提出理論假設(shè);B、根據(jù)假定結(jié)構(gòu)擬定測(cè)題,編制測(cè)驗(yàn);C
11、、以測(cè)驗(yàn)結(jié)果為根據(jù)來驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立。,(3)結(jié)構(gòu)效度的估計(jì),A、因素分析法其目的是把一些具有錯(cuò)綜復(fù)雜關(guān)系的因素歸結(jié)為數(shù)量較少的幾個(gè)綜合因素或稱共同因素,并以此測(cè)驗(yàn)所測(cè)之特質(zhì)對(duì)測(cè)驗(yàn)分?jǐn)?shù)作出解釋。B、多元特質(zhì)多重方法矩陣法是由肯貝爾和菲斯克1959年提出的最受歡迎的一種結(jié)構(gòu)效度的評(píng)估方法。這種方法的設(shè)想:若采用兩種方法以上的方法去測(cè)量?jī)煞N以上的特質(zhì),那么這些測(cè)量結(jié)果之間可以形成一個(gè)多元特質(zhì)多重方法矩陣。,,從理論上說,以不同方法測(cè)量同一特質(zhì)的相關(guān)應(yīng)當(dāng)為最高;以相同方法測(cè)量不同特質(zhì)的相關(guān)次之;以不同方法測(cè)量特質(zhì)的相關(guān)為最低。與內(nèi)容效度不同,結(jié)構(gòu)效度主要用于智力測(cè)驗(yàn)、人格測(cè)驗(yàn)等一些心
12、理測(cè)驗(yàn)方面。,3、效標(biāo)關(guān)聯(lián)效度,是以測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)之間的相關(guān)系數(shù)來表示測(cè)驗(yàn)效度高低的方法。例如:某年全國(guó)高考物理學(xué)科的測(cè)驗(yàn)效度,可用大學(xué)一年級(jí)物理學(xué)科的測(cè)驗(yàn)分?jǐn)?shù)為效標(biāo),然后求同一組學(xué)生高考物理得分與大一物理得分之間的相關(guān),此相關(guān)系數(shù)就是該年高考物理測(cè)驗(yàn)的效標(biāo)關(guān)聯(lián)效度系數(shù)。當(dāng)這個(gè)相關(guān)系數(shù)與總體零相關(guān)有顯著性差異時(shí),相關(guān)系數(shù)的值(正值)越大,效度就越高;相關(guān)系數(shù)的值越小,效度就越低。,,效標(biāo)不僅隨測(cè)驗(yàn)的種類不同而不同,而且可能隨時(shí)間而改變,現(xiàn)在是一個(gè)好的成功的效標(biāo),將來就不一定是。所以,為某個(gè)測(cè)驗(yàn)選擇一個(gè)最有效的效標(biāo),這是最重要的事情。教育測(cè)驗(yàn)的效標(biāo),可采用各學(xué)科成績(jī)和教師評(píng)定的結(jié)果;智力測(cè)驗(yàn)的效
13、標(biāo),可采用學(xué)科成績(jī)、教師評(píng)判的結(jié)果、學(xué)生總成績(jī)、受教育年限、年齡以及其他事物;能力傾向測(cè)驗(yàn)的效標(biāo),可采用特殊課程或特殊訓(xùn)練的成績(jī);職業(yè)興趣測(cè)驗(yàn)的效標(biāo),可采用從業(yè)人員實(shí)際服務(wù)成績(jī)或記錄;人格測(cè)驗(yàn)的效標(biāo),可采用編制者的主觀標(biāo)準(zhǔn),或以被試以后行為或臨床資料。,效標(biāo)關(guān)聯(lián)效度的估計(jì)方法,(1)相關(guān)法由于測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)這兩個(gè)變量的類型不同,二者相關(guān)系數(shù)的計(jì)算方法也就不同。A、積差相關(guān)法:適用于兩個(gè)變量為連續(xù)變量進(jìn)行顯著性檢驗(yàn):自由度df=N-2,檢驗(yàn)的是兩個(gè)變量,都減去2;置信度取0.05,查相關(guān)系數(shù)界值表,尋找臨界值;結(jié)論:r>臨界值,說明顯著相關(guān),效度高;r0為正區(qū)分,D<0為負(fù)區(qū)分,D=0為零區(qū)
14、分,(二)區(qū)分度的計(jì)算,1、極端分組法(1)客觀性試題D=PH-PL例6:有道試題,高分組有70%學(xué)生通過,低分組有30%的學(xué)生通過;而另一道題,高分組有40%學(xué)生通過,低分組有70%學(xué)生通過,求兩題的各自區(qū)分度?,(2)主觀題,D=(XH-XL)/N(H-L)XH為高分組得分總數(shù)XL為低分組得分總數(shù)H為該道題的最高分L為該道題的最低分N為應(yīng)試總?cè)藬?shù)的27%。,例7,高分組低分組得分X人次f得分X人次f545043413231212310140004,2、相關(guān)法,點(diǎn)二列相關(guān)法例8:15個(gè)學(xué)生在數(shù)學(xué)測(cè)驗(yàn)中得分記錄如下,計(jì)算數(shù)學(xué)測(cè)驗(yàn)中第一題的區(qū)分度?學(xué)生123456789101112131415測(cè)
15、驗(yàn)657031498050351081697855779042第一題010110100110110,二列相關(guān),例9:已知一測(cè)驗(yàn)中某選擇題的通過率為0.5,答對(duì)者的測(cè)驗(yàn)總分平均為76分,答錯(cuò)者的測(cè)驗(yàn)總分平均為63分,全體被試20人總分的標(biāo)準(zhǔn)差為16,求該題的區(qū)分度?,(三)提高區(qū)分度的方法,1、使題目的難度適中,使整個(gè)考試難度適中題目的難度適中可使區(qū)分度達(dá)到最大值,因此,使難度適中是提高區(qū)分度的重要方法。2、著重考察復(fù)雜的學(xué)習(xí)結(jié)果使高能學(xué)生得高分或低能學(xué)生得低分,使分?jǐn)?shù)盡量分布在整個(gè)分?jǐn)?shù)量尺上。3、掌握區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)。,第三章教育測(cè)驗(yàn)的編制與實(shí)施,一、教育測(cè)驗(yàn)編制的一般程序(一)確定測(cè)驗(yàn)?zāi)繕?biāo)1
16、、什么是測(cè)驗(yàn)?zāi)繕?biāo)測(cè)驗(yàn)?zāi)繕?biāo)是測(cè)驗(yàn)編制者所編制的測(cè)驗(yàn)所要達(dá)到的某種具體的目的。它明確規(guī)定測(cè)驗(yàn)所要達(dá)到的預(yù)期結(jié)果或標(biāo)準(zhǔn)。確定測(cè)驗(yàn)?zāi)繕?biāo)是編制測(cè)驗(yàn)的首要前提。,2、測(cè)驗(yàn)?zāi)繕?biāo)與教育目標(biāo)分類,測(cè)驗(yàn)?zāi)繕?biāo)的確定是以教育目標(biāo)分類理論為基礎(chǔ)的。(1)布魯姆的認(rèn)知目標(biāo)領(lǐng)域知識(shí):這是最低等級(jí)的認(rèn)知目標(biāo)。主要指記憶知識(shí)。對(duì)學(xué)過的知識(shí)和有關(guān)材料的識(shí)別和再現(xiàn)。理解:這是最低層次的理解。主要是對(duì)知識(shí)的掌握,其特點(diǎn)是脫離了“死記硬背”。應(yīng)用:指的是將學(xué)過的材料(知識(shí))應(yīng)用到新的具體情景中去。分析:指能將知識(shí)進(jìn)行分解,找出組成要素,并分析其相互關(guān)系及組成原理。綜合:與分析相反,指把各個(gè)元素或部分組成新的整體。評(píng)價(jià):指根據(jù)一定的標(biāo)準(zhǔn)
17、對(duì)事物給予價(jià)值判斷。,,布氏上述六類目標(biāo)是有層次、有順序的,知識(shí)是最低層次,是最基本的要求。其余依次是理解、應(yīng)用、分析、綜合、評(píng)價(jià)。評(píng)價(jià)為認(rèn)知領(lǐng)域的最高層次,是前面五種目標(biāo)的綜合并增加了價(jià)值標(biāo)準(zhǔn)。這六類目標(biāo),由簡(jiǎn)單到復(fù)雜,由低級(jí)到高級(jí)依次排列,組成層次結(jié)構(gòu)。,(2)我國(guó)認(rèn)知目標(biāo)的分類,A、五分法知識(shí)理解應(yīng)用分析綜合創(chuàng)造B、四分法識(shí)記理解簡(jiǎn)單運(yùn)用綜合運(yùn)用,(二)確定測(cè)驗(yàn)內(nèi)容,測(cè)驗(yàn)內(nèi)容的確定,實(shí)際上也就是內(nèi)容抽樣的決定和測(cè)驗(yàn)?zāi)繕?biāo)的確立相結(jié)合而成。這一結(jié)合過程必須通過命題雙向細(xì)目表來確定。命題雙向細(xì)目表由3個(gè)要素構(gòu)成:測(cè)驗(yàn)?zāi)繕?biāo)測(cè)驗(yàn)內(nèi)容測(cè)驗(yàn)?zāi)繕?biāo)和測(cè)驗(yàn)內(nèi)容的比例,比例確定標(biāo)準(zhǔn),每一內(nèi)容范圍的比例應(yīng)與該內(nèi)
18、容項(xiàng)目在整個(gè)教學(xué)領(lǐng)域里的相對(duì)重要性相符合,這種相對(duì)重要性可由該內(nèi)容項(xiàng)目的教學(xué)課時(shí)的多少來體現(xiàn);每一目標(biāo)層次所要求的比例應(yīng)當(dāng)與測(cè)驗(yàn)編制者認(rèn)為這個(gè)目標(biāo)對(duì)所受測(cè)學(xué)生的水平所具有的重要性相符。測(cè)驗(yàn)雙向細(xì)目表,是編制測(cè)驗(yàn)的藍(lán)圖,它詳細(xì)說明了測(cè)驗(yàn)的內(nèi)容、測(cè)驗(yàn)?zāi)繕?biāo),對(duì)試題數(shù)量、考試時(shí)間安排、測(cè)驗(yàn)分?jǐn)?shù)分配等,都起著重要作用,因此,它是編制測(cè)驗(yàn)必不可少的一環(huán)。,測(cè)驗(yàn)材料的收集必須遵循的原則:,1、測(cè)驗(yàn)材料要適合測(cè)驗(yàn)?zāi)康?、測(cè)驗(yàn)材料要能夠代表該教材的全部?jī)?nèi)容3、測(cè)驗(yàn)材料要有普遍性4、測(cè)驗(yàn)材料要適合學(xué)生程度并能鑒別學(xué)生的學(xué)習(xí)水平5、測(cè)驗(yàn)材料要能激發(fā)學(xué)生的進(jìn)取心,(三)測(cè)驗(yàn)設(shè)計(jì),1、測(cè)驗(yàn)形式的確定2、測(cè)驗(yàn)題目形式的確
19、定3、測(cè)驗(yàn)具體題型的確定與題目編制4、測(cè)驗(yàn)題目量的確定5、測(cè)驗(yàn)時(shí)間的確定6、測(cè)驗(yàn)題目的編制先按試題的形式及內(nèi)容分類從易到難排列,二、測(cè)驗(yàn)題目編制技術(shù),1、客觀性測(cè)驗(yàn)題目的編制(約占60%左右)試題應(yīng)反映教學(xué)內(nèi)容的重點(diǎn)或教學(xué)過程中要求學(xué)生掌握的有意義的內(nèi)容和知識(shí)點(diǎn);務(wù)必使每道試題自成一體,不可互相牽扯;試題文字力求淺顯易懂,題意明確;試題的答案應(yīng)該是明確且唯一的;試題應(yīng)按教育目標(biāo)的要求,內(nèi)容不能超過受測(cè)者的知識(shí)和能力。,2、主觀性測(cè)驗(yàn)題目的編制(大約占40%左右),試題應(yīng)考查教育內(nèi)容中的重要問題;把問題和實(shí)際情景結(jié)合起來,強(qiáng)調(diào)知識(shí)的應(yīng)用;要給被試發(fā)揮自己創(chuàng)造力的余地;要使答案的復(fù)雜程度與被試的成
20、熟程度相符。,三、教育測(cè)量分?jǐn)?shù)的整理和分析,編制頻數(shù)分布表求組中值求全矩求組數(shù)求組限畫頻數(shù)分布曲線圖,分析頻數(shù)曲線圖,1、常態(tài)分布即成績(jī)中等的多,優(yōu)秀和差的少,俗稱“中間大,兩頭小”。學(xué)生的學(xué)業(yè)成績(jī)呈常態(tài)分布,表明能正確、客觀地反映學(xué)生真實(shí)的知識(shí)程度和能力水平。這是因?yàn)閷W(xué)生智力及其差異,一般是呈常態(tài)分配的;另外,教學(xué)大綱的制定、教材的編寫、考試命題都是從大多數(shù)中等程度學(xué)生的實(shí)際出發(fā),為大多數(shù)中等水平的學(xué)生經(jīng)過努力能接受的。2、正偏態(tài)分布即低分人數(shù)很多,高分人數(shù)很少。學(xué)生的學(xué)業(yè)成績(jī)呈正偏態(tài)分布,表明測(cè)試難度過大,考試要求過高,超越大綱和教材的要求;或者學(xué)生的基礎(chǔ)差,應(yīng)調(diào)整試題的難度或教學(xué)進(jìn)度。3
21、、負(fù)偏態(tài)分布即高分人數(shù)很多,低分人數(shù)很少。學(xué)生的學(xué)業(yè)成績(jī)呈負(fù)偏態(tài)分布,表明測(cè)試較易,考試要求低于大綱或教材要求;或?qū)W生的基礎(chǔ)好,應(yīng)加大試題的難度和教學(xué)的進(jìn)度。,,4、駝峰型分布即低分高分人數(shù)很多,中分人數(shù)很少。學(xué)生的學(xué)業(yè)成績(jī)呈駝峰型分布,表明試題難度過大和過小的題較多,中等難度的太少;或表明學(xué)生基礎(chǔ)相差懸殊,好的和差的學(xué)生多,中等程度的學(xué)生較少。5、平波型分布即中低高分人數(shù)差不多。學(xué)生的學(xué)業(yè)成績(jī)呈平波型分布,表明大中小幾種難度的試題比較接近,或?qū)W生的基礎(chǔ)相差不大,試題區(qū)分度低,需要提高區(qū)分度。6、陡峭型分布即中分人數(shù)很多,低高分人數(shù)極少。學(xué)生的學(xué)業(yè)成績(jī)呈陡峭型分布,表明難度中等的試題比例過大,缺乏區(qū)分度或?qū)W生的基礎(chǔ)相差不大,要提高試題的區(qū)分度。,,學(xué)生的成績(jī)分布曲線的形態(tài)多種多樣,是教學(xué)過程中多種現(xiàn)象的反映,這些現(xiàn)象都是通過原因與結(jié)果的連續(xù)和交織形成的。造成這種現(xiàn)象的原因是復(fù)雜的,往往與教師的教學(xué)態(tài)度、教學(xué)水平、教學(xué)經(jīng)驗(yàn)有關(guān),與學(xué)生的學(xué)習(xí)態(tài)度、學(xué)習(xí)基礎(chǔ)、學(xué)習(xí)方法、學(xué)習(xí)習(xí)慣有關(guān),與學(xué)校的思想政治工作和行政管理工作質(zhì)量有關(guān),與社會(huì)因素和家庭教育有關(guān)。,逐題分析法,就是對(duì)試卷中每一道題的得分和失分情況進(jìn)行分析,將每題的高分率(指該題高于應(yīng)得分?jǐn)?shù)的90%的人數(shù)的百分比)、及格率、不及格率和零分率統(tǒng)計(jì)出來,以便分析學(xué)生對(duì)每道試題的掌握情況和存在問題。,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 外科營(yíng)養(yǎng)支持病人的護(hù)理 (2)
- 電子商務(wù)師基礎(chǔ)知識(shí)培訓(xùn)教案PPT課件
- 三重積分的概念與性質(zhì)分析
- 輸液外滲處理及預(yù)防課件
- 輔導(dǎo)員說課之認(rèn)識(shí)你自己課件
- 火山與地震課件
- 4.網(wǎng)站的開發(fā)技術(shù)
- 部編版三年級(jí)上冊(cè)語(yǔ)文第六單元海濱小城(完美版)課件
- 部編版七年語(yǔ)文下冊(cè)《4孫權(quán)勸學(xué)》課件【2020精編】
- 古詩(shī)欣賞3--舟夜書所見課件
- 發(fā)生骨質(zhì)疏松癥的病因和高危人群課件
- 皂基原料及生產(chǎn)工藝課件
- 《芽的類型和發(fā)育》課件-(公開課獲獎(jiǎng))2022年濟(jì)南版
- 超越以往的實(shí)用圖表 (15)
- 第六章 審計(jì)風(fēng)險(xiǎn)