現(xiàn)代教育測量與評價學(xué)
《現(xiàn)代教育測量與評價學(xué)》由會員分享,可在線閱讀,更多相關(guān)《現(xiàn)代教育測量與評價學(xué)(11頁珍藏版)》請在裝配圖網(wǎng)上搜索。
現(xiàn)代教育測量與評價學(xué) 1、一次考試中某生在50名學(xué)生中排名第13名,則該生的百分等級應(yīng)該是【 B 】A.13 B. 26 C. 50 D. 74 2、在現(xiàn)代測驗理論的諸多模式中,最具有優(yōu)越性的是 【 B 】A.經(jīng)典測驗理論B.項目反應(yīng)理論C.心理測驗理論D.智力測驗理論 3、適合于某些用于選拔和分類的職業(yè)測驗的效度是【 B 】 A.時間效度 B.內(nèi)容效度 C.效標(biāo)關(guān)聯(lián)效度 D.結(jié)構(gòu)效度 4、韋克斯勒智力測驗屬于 【 B 】 A.限時測驗和典型作為測驗 B.限時測驗和最高成就測驗 C.非限時測驗和典型作為測驗 D.非限時測驗和最高成就測驗 5、測驗被試回憶或辨認某些特定事實的能力的認知層次是【A 】A.知識 B.應(yīng)用 C.分析 D.綜合 6、學(xué)生成績測驗的主要類型有安置性測驗、形成性測驗、診斷性測驗和【 D 】 A.智力測驗 B.能力傾向測驗 C.人格測驗D.總結(jié)性測驗 7、學(xué)業(yè)成績是一個 【 D 】 A.名義變量 B.順序變量 C.等距變量 D.比率變量 8、通常認為|r|<0.2時稱為 【 A 】 A.極低相關(guān) B.低相關(guān) C.中等相關(guān) D.高相關(guān) 9、根據(jù)測驗編制程序的嚴格程度,可以簡單地把學(xué)業(yè)成就測驗分成教師自編課堂成就測驗和 【 D 】 A.標(biāo)準(zhǔn)參照測驗 B.紙筆測試 C.安置性測驗 D.標(biāo)準(zhǔn)化成就測驗 10、下面題型中屬于客觀題的是 【 D 】 A.計算題B.證明題 C.作圖題 D.選擇題 11、最重要的測驗質(zhì)量指標(biāo)是 【 A 】 A.難度 B.區(qū)分度 C.梯度D.效度 12、評價的重點在于“過程”的評價是 【 B 】 A.診斷性評價 B.形成性評價 C.總結(jié)性評價 D.整體性評價 13、在布魯姆認知領(lǐng)域教育目標(biāo)分類中,層次最低的是【 D 】 A.領(lǐng)會 B.應(yīng)用 C.分析 D.知識 14、學(xué)生的英語測驗成績屬于 【 B 】 A.名義量尺 B.順序量尺 C.等距量尺 D.比率量尺 15、內(nèi)容效度的評估方法不包含 【 B 】 A、專家判斷法 B、雙向細目表法C、統(tǒng)計分析法 D、經(jīng)驗推測法 . 16、下列幾種效度中,不具有效度真正意義的是 【 C 】 A.結(jié)構(gòu)效度 B.內(nèi)容效度 C.表面效度 D.效標(biāo)關(guān)聯(lián)效度 17、學(xué)期初或單元教學(xué)開始時使用的測驗是 【 A 】 A.安置性測驗 B.形成性測驗 C.終結(jié)性測驗 D.能力傾向性測驗 18、標(biāo)準(zhǔn)化考試產(chǎn)生于 【 C 】 A.19世紀末 B.20世紀初 C.20世紀40年代 D.20世紀60年代 19、教育測量專家格蘭朗德認為,一個完整的評價計劃,可用公式形象地表達,其公式是 【 C 】 A.評價=測量+評定+價值判斷B.評價=測量+定量描述+定性判斷 C.評價=測量+非測量+價值判斷 D.評價=測量+非測量+統(tǒng)計推斷 20、百分等級反映數(shù)據(jù)在其次數(shù)分布中的 【 A 】 A.相對地位 B.集中趨勢 C.誤差大小 D.差異程度 21、一個隨機變量所有取值點的概率之和為 【 B 】 A. 0 B. 1 C. 2 D. 3 二、填空題 1、教育調(diào)查依據(jù)目的可分為兩類:一是( 常模調(diào)查 ),一是比較調(diào)查。 2、“記”是一種感知過程,心理學(xué)上也稱為識記,可分為有意識記與無意識記,也可分為( 機械識記 )與理解識記等。 3、泰勒指出:“評價過程在本質(zhì)上是確定課程和教學(xué)大綱在實際上實現(xiàn)( 教育目標(biāo) )的程度的過程” 4、所謂指標(biāo)結(jié)構(gòu)性教育評價表,就是根據(jù)評價目標(biāo)逐層分解評價指標(biāo),形成具有評價指標(biāo)體系、( 指標(biāo)權(quán)重結(jié)構(gòu) )以及定性定量具體評價標(biāo)準(zhǔn)的教育評價表。 5、有代表性的樣組,也稱為( 常模團體 ),指的是在建立測驗常模過程中實際受測被試樣組,他們代表著一個有明確定義的人群。 6、人們在解釋教育測量和評價的結(jié)果時,總是要選擇某種參照點。這樣,教育測量評價可大致分成常模參照、 ( 標(biāo)準(zhǔn)參照 )和潛力參照三種。 7、以教育目標(biāo)或標(biāo)準(zhǔn)為參照來評價學(xué)生發(fā)展,需要貫徹“多元的教育目標(biāo)與(多元的評價方法)相適應(yīng)”的原則。 8、所謂量表或量尺,指的是確定了測量單位和參照點并具有( 取值系統(tǒng) )的測量工具。 9、教育評價表在結(jié)構(gòu)上是由評價指標(biāo)、指標(biāo)權(quán)重及( 評價標(biāo)準(zhǔn) )三部分組成的。 10、同質(zhì)性信度也叫( 內(nèi)部一致性系數(shù) )信度,它是指測驗內(nèi)部所有題目間的一致性程度。 三、名詞解釋 1、教育測量 答:教學(xué)測量是考核教學(xué)成效的一種方法,是一種收集資料數(shù)據(jù)的過程。它是借助于一定的教育測量工具及其操作,根據(jù)某種標(biāo)準(zhǔn)和一定的操作程序,將學(xué)生的學(xué)習(xí)行為與結(jié)果確定為一種量值,以表示學(xué)生對所測問題了解的多少。即通過觀察少數(shù)具有代表性的行為或現(xiàn)象來量化描述人的心理特征,為了減少誤差,測驗在編制、施測、評分以及解釋等方面都必須遵循一套系統(tǒng)的程序。 2.句子完成測驗答:又稱作填句測驗,去完成的句子(詞干)構(gòu)成,并且這些語句多為 情境性、情緒性的。 2、 品德情境測評法 答:指測評者設(shè)置一定的情境和標(biāo)準(zhǔn),并觀察被測評者在該情境中的反應(yīng),根據(jù)事先規(guī)定的標(biāo)準(zhǔn)對被測評者的品德發(fā)展?fàn)顩r做出評價的方法。簡而言之,是指對個體品德的測量與評價。 3、 效度 答:即有效性,它是指測量工具或手段能夠準(zhǔn)確測出所需測量的事物的程度。效度是指所測量到的結(jié)果反映所想要考察內(nèi)容的程度,測量結(jié)果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低。效度分為三種類型:內(nèi)容效度、準(zhǔn)則效度和結(jié)構(gòu)效度。 4、 高考標(biāo)準(zhǔn)分數(shù)制度 答:高考標(biāo)準(zhǔn)分數(shù)制度由常模量表分數(shù)(包括全國常模和省常模)、等值量表分數(shù)組成。 5.難度 答:難度即測試題目的難易程度.一般在能力方面的測試中,它作為衡量測試題目質(zhì)量的主要指標(biāo)之一。它是衡量試題質(zhì)量的一個重要指標(biāo)參數(shù),它和區(qū)分度共同影響并決定試卷的鑒別性。 難度:難度指被試完成測驗或量表時所遇到題目的難易程度記為P。 難度:指試題的難易程度,即某個試題的通過率(答對或通過試題的人數(shù)比例) 5、 常模 答:常模是一種供比較的標(biāo)準(zhǔn)量數(shù),由標(biāo)準(zhǔn)化樣本測試結(jié)果計算而來,即某一標(biāo)準(zhǔn)化樣本的平均數(shù)和標(biāo)準(zhǔn)差。 7.教育目標(biāo) 答:教育目標(biāo)(educational goal)就是指所培養(yǎng)的人才應(yīng)達到的標(biāo)準(zhǔn).這個目標(biāo)可高可低按需而定(教育目標(biāo)是培養(yǎng)人的方向和規(guī)格)。是反映教育目的的,具體而可觀測的變化(或進步)。 7.真分數(shù) 答:值小于1的分數(shù),即分子小于分母(二者都是正整數(shù))的分數(shù)稱為真分數(shù),但等于1不算(那屬于假分數(shù))。真分數(shù):被試在所測特質(zhì)上客觀具有的水平值。 四、簡答題 1、簡述羅杰斯關(guān)于健康人格的具體特征 答:①情感和態(tài)度上是無拘無束的、開放性的,沒有任何東西需要防備;②對新的經(jīng)驗有很強的適應(yīng)性,能夠自由地分享這些經(jīng)驗;③信任自己的感覺;④有自由感;⑤具有高度的創(chuàng)造力。 2、簡述課業(yè)考評改革的主要目標(biāo) 答:a.首先要實現(xiàn)考試觀向發(fā)展性評價觀的轉(zhuǎn)變,b.要努力實現(xiàn)從重視“掌握性結(jié)果”的評價轉(zhuǎn)變既重視“掌握性結(jié)果”又重視“發(fā)展性結(jié)果”的評價;c.內(nèi)容要從認知領(lǐng)域轉(zhuǎn)變到涵蓋學(xué)習(xí)結(jié)果更廣泛的教育目標(biāo)領(lǐng)域上d.要努力實現(xiàn)從表征性分數(shù)機制到實質(zhì)性內(nèi)容機制的轉(zhuǎn)變。 3、簡述教育測量與評價按照按測量與評價的內(nèi)容如何分類 答:1)按運用時機分:形成性測量與評價;診斷性測量與評價;終結(jié)性測量與評價2)按解釋測量結(jié)果或評價結(jié)果時的參照點分類:常模參照測量與評價;標(biāo)準(zhǔn)參照測量與評價3)按測量與評價被試行為表現(xiàn)的性質(zhì)分類:最佳行為測量與評價;典型行為測量與評價4)按量表的標(biāo)準(zhǔn)化程度可分為標(biāo)準(zhǔn)化測驗和非標(biāo)準(zhǔn)化測驗 2、 簡述課業(yè)考的主要作用 答:1.課業(yè)考評的主要作用:首先,合理的課業(yè)考評制度為學(xué)生發(fā)展提供較明確的目標(biāo)和努力的方向;其次,合理的課業(yè)考評制度將有助于評價學(xué)生的發(fā)展進步,從而對教與學(xué)雙方活動起著重要的控制、調(diào)節(jié)和促進等作用;再次,課業(yè)考評為學(xué)生心理發(fā)展和學(xué)習(xí)進步創(chuàng)造必要的背景和空間,誘發(fā)學(xué)生的學(xué)習(xí)動機和自主發(fā)展的動力;最后,課業(yè)考評在中小學(xué)生個體社會化進程中起著控制、調(diào)節(jié)、促進和加速的作用。 簡述多元智力學(xué)校教育的基本特征 答:多元智力理論有下列主要特點:一是多元性。二是文化性。三是差異性。四是實踐性。五是開發(fā)性 4、簡述表現(xiàn)性測驗類型 答:(一)口頭測驗(二)論辯或辯論(三)短文題考試(四)寫作測驗?。ㄎ澹┻^程反應(yīng)題(六)實驗技能教學(xué)考試評價 5、 簡述主觀題的編制原則 答:1.如果測量的行為目標(biāo)能夠用客觀題來測,就盡量不要用主觀題。2.挑選的材料應(yīng)該與學(xué)生學(xué)習(xí)經(jīng)歷過的材料有類似性或是全新的材料。 3.設(shè)計的試題應(yīng)該能夠測量相關(guān)的行為目標(biāo)并且與某一內(nèi)容領(lǐng)域相關(guān)。 4.應(yīng)該用清晰、明確的語言表述背景材料和問題。 5.對材料分析題而言,設(shè)計試題應(yīng)該對材料進行分析和解釋。 6.設(shè)計的試題數(shù)應(yīng)該與背景材料的長度相匹配。 7.對試題的賦分應(yīng)該合理。 8.對每個問題給以適當(dāng)?shù)耐瓿蓵r間。 突出重點 結(jié)合世界 允許發(fā)揮 答案多樣 難度適宜 6、簡述在高考中使用原始分數(shù)的局限性 答:(1)原始分數(shù)未能反映考試分數(shù)相對于團體的位置信息。(2)不同科目或同一科目不同次考試之間分數(shù)可比較差。(3)原始分數(shù)不宜直接相加。(4)在高考中不便于控制各科目的權(quán)重。(5)在教育評價時,常提供不客觀、不準(zhǔn)確的信息。 6、 簡述常模的用途 答:常模的作用是讓測驗者明白測驗結(jié)果分數(shù)的意義。心理測驗是一種測量人的心理狀態(tài)的技術(shù)手段,如同一個醫(yī)生量一下你的血壓就可以知道你的血壓是否偏高偏低一樣,心理測驗也希望達到類似的心理測量的目的。 五、論述題 1、常模參照測驗、標(biāo)準(zhǔn)參照測驗所要求的項目恰當(dāng)難度及難度分布是什么?為什么?答:(1)常模參照測驗的項目恰當(dāng)難度是P值盡量接近0.50。因為只有在這種情況下,題目區(qū)分性能最好,(2)常模參照測驗所要求的項目恰當(dāng)難度分布是,圍繞P=0.50這個點,有一個適當(dāng)寬的全距。(3)這樣的原因有以下兩個:一是測驗時,通常希望開始有幾個難度較低的題目來穩(wěn)定被試情緒,末尾用幾個難度稍大的題目以便只有少數(shù)高水平者才能通過。(4)二是讓全部項目都取0.50的難度,通常難以實現(xiàn)。當(dāng)然,在允許有適當(dāng)寬的全距的前提下,仍然要力爭大多數(shù)項目難度取值接近0.50。(5)標(biāo)準(zhǔn)參照測驗的目的是要考察被試的水平是否達到應(yīng)有要求,因而測驗項目的難度,就不應(yīng)由被試的實際通過率來決定,而應(yīng)由項目的考核要求是否體現(xiàn)應(yīng)有標(biāo)準(zhǔn)或教學(xué)目標(biāo)來決定。(6)無論項目的通過是高還是低,只有體現(xiàn)了應(yīng)用的標(biāo)準(zhǔn)或教學(xué)目標(biāo),項目的難度就是合理的恰當(dāng)?shù)摹? 2、舉例說明結(jié)構(gòu)效度驗證步驟 答:(1)考察測驗的內(nèi)容效度,因為有些測驗對所測內(nèi)容或行為范圍的定義或解釋類似于理論構(gòu)想的解釋,所以內(nèi)容效度高實質(zhì)上也說明結(jié)構(gòu)效度高。(2)計算測驗的同質(zhì)性信度的方法來檢測結(jié)構(gòu)效度。若有證據(jù)表明測驗不同質(zhì),則可以斷定該測驗結(jié)構(gòu)效度不高。3)利用相容效度法,考察新編制的測驗與某個已知的能有效測量相同特質(zhì)的測驗之間的相關(guān)。若兩者相關(guān)較高,則說明新測驗有較高的效度。 (4)利用區(qū)分效度法,考察新編測驗與某個已知的能有效測量不同的特質(zhì)的舊測驗間的相關(guān)。若兩者相關(guān)較高,表明測到了其他心理特質(zhì),則新測驗效度不高。(5)對一組測驗進行因素分析,找出影響測驗的共同因素,每個測驗在共同因素上的負荷量(即測驗與各因素的相關(guān))就是測驗的因素效度,測驗分數(shù)總變異中來自有關(guān)因素的比例就是該測驗結(jié)構(gòu)效度的指標(biāo)。(6)綜合應(yīng)用相容效度法和區(qū)分效度法,若用多種極不相同的方法測量同一種特質(zhì)相關(guān)很高,或用極為相似的方法測量不同特質(zhì)相關(guān)很低,則說明測量效度很高。若有多種特質(zhì)都接受了多種方法的測量,就可以分別計算出任意兩種方法測量同一種特質(zhì)的相關(guān)和測量不同特質(zhì)的相關(guān),以及任意兩種特質(zhì)接受同一方法和不同方法的相關(guān)。- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
15 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 現(xiàn)代教育 測量 評價
鏈接地址:http://m.appdesigncorp.com/p-10660263.html