《教育統(tǒng)計與測量評價》復習資料(共10頁)
《《教育統(tǒng)計與測量評價》復習資料(共10頁)》由會員分享,可在線閱讀,更多相關(guān)《《教育統(tǒng)計與測量評價》復習資料(共10頁)(10頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、精選優(yōu)質(zhì)文檔-----傾情為你奉上 《教育統(tǒng)計與測量評價》復習資料 一、單項選擇題 1、觀測數(shù)據(jù)為98、90、70、75、83、80,這組數(shù)據(jù)的全距是( C )。 A、98 B、70 C、28 D、18 2、兩個行為變量的觀測值皆為順序變量,則研究這兩個變量之間的相關(guān)系數(shù)時,宜用( B )。 A、積差相關(guān)系數(shù) B、等級相關(guān)系數(shù) C、點雙列相關(guān)系數(shù) D、雙列相關(guān)系數(shù) 3、在一批考試分數(shù)中,百分等級為76的分數(shù)是37分,這意味著比37分高的考生人數(shù)占 全部考生總數(shù)比例是( A )。 A、24% B
2、、37% C、63% D、76% 4、在正態(tài)分布中,已知概率P(0<Z≤1)=0.34134,試問概率P(Z<-1)的值為( D )。 A、0.84134 B、0.65866 C、0.34134 D、0.15866 5、投擲一粒骰子,出現(xiàn)“4”點的概率是( A )。 A、1/6 B、1/4 C、1/2 D、1 6、測驗藍圖設(shè)計是關(guān)于( B ) A、測驗內(nèi)容和測驗題型的抽樣方案
3、 B、測驗內(nèi)容和考查目標的抽樣方案 C、試驗時間和測驗題目的抽樣方案 D、測驗時間和考查目標的抽樣方案 7、面試共有6題并采用放回抽取原則,問兩個考生抽取同為B題的概率為( D )。 A、1/6 B、1/12 C、1/18 D、1/36 8、每項評價指標在指標體系中所占的重要性程度,經(jīng)量化后的值叫( A ) A、權(quán)重 B、加權(quán) C、標度 D、強度 9、教育測量專家格
4、蘭朗德認為,一個完整的評價計劃,可以用公式加以形象地表達,其公式是( C ) A、評價=測量+評定+價值判斷 B、評價=測量+定量描述+定性判斷 C、評價=測量+非測量+價值判斷 D、評價=測量+非測量+統(tǒng)計推斷 10、復本信度和重測信度這兩種方法的最大差別是( C )。 A、不是同一批被試 B、計算誤差大小 C、不是同一份測驗 D、計算方法 11、積差相關(guān)系數(shù)的創(chuàng)立者是( A )。 A、皮爾遜 B、斯皮爾曼 C、達爾文 D、高爾頓 12、已知=5,=6,=7,=3,=4則等于( A )。 A、16
5、 B、20 C、21 D、25 13、在一批考試分數(shù)中,百分等級為56的分數(shù)是65分,這意味著比65分高的考生人數(shù)占全部考生總數(shù)比例是( B )。 A、36% B、44% C、56% D、65% 14、下列分類屬于按照測量與評價的內(nèi)容劃分的是(B ) A、形成性與總結(jié)性測量與評價 B、智力與成就測量與評價 C、常模參照與標準參照測量與評價 D、診斷性與個人潛能測量與評價 15、某班50名學生中有30名女生,問抽取一個學生恰好為男生的比例是(C )。
6、 A、1/30 B、1/20 C、2/5 D、3/5 16、測驗藍圖設(shè)計是關(guān)于( B )。 A、測驗內(nèi)容和測驗題型的抽樣方案 B、測驗內(nèi)容和考查目標的抽樣方案 C、試驗時間和測驗題目的抽樣方案 D、測驗時間和考查目標的抽樣方案 17、Z分數(shù)量表是( B )。 A、稱名量表 B、等距量表 C、順序量表 D、等比量表 18、已知P(0<Z<1.96)=0.475,則P(|Z|>1.96)概率值為( B )
7、 A、0.025 B、0.05 C、0.525 D、0.95 19、重測信度的用途有時也在于評估所測特質(zhì)在短期內(nèi)的( C )。 A、 有效性 B、可測性 C、穩(wěn)定性 D、等值性 20、教育測量專家格蘭朗德認為,一個完整的評價計劃,可以用公式加以形象地表達,其公式是( C ) A、評價=測量+評定+價值判斷 B、評價=測量+定量描述+定性判斷 C、評價=測量+非測量+價值判斷 D、評價=測量+非測量+統(tǒng)計推斷 21、有一組數(shù)據(jù)是測量身高的,一組是測量體重的,若比較兩組數(shù)據(jù)的離散程度,則用(
8、 D )。 A、平均差 B、標準差 C、方差 D、差異系數(shù) 22、某次考試之后對數(shù)據(jù)進行統(tǒng)計分析,求得第56百分位數(shù)是65分,這意味著考分高于65分的考生人數(shù)比例為( B )。 A、35% B、44% C、56% D、65% 23、下列分類屬于按照測量的內(nèi)容劃分的是( B ) A、形成性與總結(jié)性測量與評價 B、智力與成就測量與評價 C、常模參照與標準參照測量與評價 D、診斷性與個人潛能測量與評價 24、標準正態(tài)分布的平均數(shù)和標準差分別是( A ) A、0 和1 B、-3和+3 C、-1和1 D、-4和+4
9、 25、在正態(tài)分布中,已知概率P(0<Z≤1)=0.34134,試問:概率P(Z<-1)的值為( B )。 A、0.84134 B、0.65866 C、0.34134 D、0.15866 26、測驗藍圖設(shè)計是關(guān)于( B ) A、測驗內(nèi)容和測驗題型的抽樣方案 B、測驗內(nèi)容和考查目標的抽樣方案 C、試驗時間和測驗題目的抽樣方案 D、測驗時間和考查目標的抽樣方案 27、同時擲兩個骰子,出現(xiàn)12個點的概率為( D ) A、1/6 B、1/12 C、1/18 D、1/36 28、每項評價指標在指標體系中
10、所占的重要性程度,經(jīng)量化后的值叫( A ) A、權(quán)重 B、加權(quán) C、標度 D、強度 29、教育測量專家格蘭朗德認為,一個完整的評價計劃,可以用公式加以形象地表達,其公式是( C ) A、評價=測量+評定+價值判斷 B、評價=測量+定量描述+定性判斷 C、評價=測量+非測量+價值判斷 D、評價=測量+非測量+統(tǒng)計推斷 30、重測信度的用途有時也在于評估所測特質(zhì)在短期內(nèi)的( C )。 B、 有效性 B、可測性 C、穩(wěn)定性 D、等值性 31.學習教育統(tǒng)計與測量對教育工作者
11、十分重要,它是( A ) A.教育研究的重要方法與工具 B.測量的重要方法與工具 C.寫文章的重要方法 D.教學的重要手段 32.假如我們希望通過一個統(tǒng)計表就能較方便地了解處于某個分數(shù)以下的人數(shù),這時可編制一個( C ) A.絕對次數(shù)分布表 B.相對次數(shù)分布表 C.累積次數(shù)分布表 D.累積相對次數(shù)分布表 33.下列數(shù)據(jù)中,不能進行加、減、乘、除運算,只可對每一類別計算次數(shù)或個數(shù)的是( A ) A.稱名變量 B.順序變量 C.等距變量 D.比率變量 34.適合顯示各統(tǒng)計事項占總體比例的圖形是( C ) A.散點圖 B.條形圖 C.圓形圖 D.線
12、形圖 35.下面屬于地位量數(shù)的是( B ) A. B.PR C.S D. 36.提出等級相關(guān)法的統(tǒng)計學家是( D ) A.布魯姆 B.皮爾遜 C.比內(nèi) D.斯皮爾曼 37.百分等級數(shù)值是( D ) A.名義變量 B.順序變量 C.等距變量 D.比率變量 38.下列布魯姆認知領(lǐng)域教育目標分類中,層次最低的是( A ) A.知識 B.領(lǐng)會 C.應(yīng)用 D.分析 39.利用韋克斯勒智力測驗量表測查某校小學二年級學生,平均數(shù)為102,標準差為18,某學生得分為120,那么他的離差智商為( C ) A.110 B.115 C.120 D.125 4
13、0.是非題的特點是( C ) A.不容易猜測 B.評分誤差大 C.適用范圍有限 D.單位時間內(nèi)答題量少 41.標準參照測驗的用途( D ) A.用于教育工作的選拔決策 B.用于教育工作分流決策 C.用于鑒別學生能力 D.用于評價課堂教育與課程編制的有效性 42.吉爾福特根據(jù)研究得出,發(fā)散性思維在行為上表現(xiàn)出的特征有流暢性、變通性和( C ) A.敢為性 B.創(chuàng)造性 C.獨特性 D.穩(wěn)定性 43.平均數(shù)的抽樣分布近似服從正態(tài)分布所需的樣本容量至少為( C ) A.10 B.20 C.30 D.40 44.統(tǒng)計假設(shè)檢驗中,虛無假設(shè)又稱為(
14、A ) A.零假設(shè) B.備擇假設(shè) C.研究假設(shè) D.統(tǒng)計假設(shè) 45.統(tǒng)計假設(shè)檢驗中關(guān)于單側(cè)檢驗描述不正確的是( A ) A.顯著性水平值平分在抽樣分布兩尾 B.危機域只有一塊 C.檢驗?zāi)康臑榱送茢嗄硞€總體參數(shù)是否大于某個定值 D.抽樣分布只有一個尾側(cè)沒有臨界值 二、概念解釋 1散點圖 1畫在平面直角坐標系中表示兩種事物之間相互關(guān)系及聯(lián)系模式的一種圖示方法。 2標準參照測量與評價 2標準參照測量與評價是將被試的表現(xiàn)與既定的教育目標和行為標準相比較,以評價被試在多大程度上達到該標準的一種測量與評價。 3教育測量 3教育測量是針對學校教育影響下學生各方面的
15、發(fā)展,側(cè)重于量的規(guī)定性予以確定和描述的過程。 4教育評價 4教育評價是按照一定的價值標準和教育目標,利用測量和非測量的種種方法系統(tǒng)地收集資料信息,對學生的發(fā)展變化及其影響學生發(fā)展變化的各種要素進行價值分析和價值判斷,并為教育決策提供依據(jù)的過程。 5測驗的效度 5測驗?zāi)軠y出所欲測特質(zhì)的程度,相對于某種測量目標而言。 6等距變量 6 除了能表明量的大小外還具有相等的單位,而且其零點是相對的。 7標準化測驗 答:如果測量工具、施測與評分程序、解釋分數(shù)的參照系(或標準)都已科學地實現(xiàn)標準化,也就是說,這種代表性行為樣本的客觀而標準化的測量,就稱之為標準化測驗。 8.組內(nèi)常模
16、答:組內(nèi)常模是解釋被試原始分數(shù)的參照體系,即被試所屬那類群體的人(實際上即常模組被試)在所測特性上測驗取值(也就是分數(shù))的分布狀況;拿被試分數(shù)跟這種分數(shù)分布狀況作對比,就能揭示出被試在其所屬那類群體(即常模組)中的相對地位。 9.學習能力傾向測驗 答:學習能力傾向測驗旨在測量一般的學習能力和潛力,即是否具備較好的進一步學習與研究的潛在能力,而不是已在學校中學到了多少知識。 10.顯著性水平 答:在統(tǒng)計假設(shè)檢驗中,公認的小概率事件的概率值被稱為統(tǒng)計假設(shè)檢驗的顯著性水平。 三、問答題 1客觀題的主要優(yōu)缺點是什么? 優(yōu):客觀;信息量大,覆蓋面廣;誤差小信度高;適合測量明確的知識點。
17、 缺點:難測高層次的心智技能;不易測文字表達和創(chuàng)新思維能力。 2試述教育測量與教育評價之間的關(guān)系。 教育測量與教育評價之間有聯(lián)系有區(qū)別;教育測量側(cè)重于量的規(guī)定性方面去把握事物;教育評價關(guān)注價值判斷,包括優(yōu)缺點分析;教育測量是教育評價的基礎(chǔ);評價又是教育測量的延伸和功能釋能;有些情況下教育測量本身就是系統(tǒng)的教育評價過程。 3為什么說教育測量與評價在教育中有著重要作用? 在教育系統(tǒng)中對實現(xiàn)教育目標起重要的作用;是課程改革的重要組成部分;教育改革常常把測量與評價的改革或反思作為突破口。 4請以你熟悉的一門課程試卷為例談一下怎樣制作命題雙向細目表? 以教學內(nèi)容和目標分類為維度并結(jié)合某
18、門課程列出命題雙項細目表,舉例略 5當前學校的學生課業(yè)考評存在哪些主要問題? 過于強調(diào)選拔、方法單一、考評抽象和表征化。 6、為什么說教育測量與評價是教師必備的知識技能? 正確評價學生是教師的一種職業(yè)能力;教師需要測量與評價的方法彌補非正式觀察和書面考試的不足;實踐證明評價是所有成功教學的基礎(chǔ);發(fā)達國家教師教育普遍學習教育測量與評價之類的課程。 7、怎樣分析一份試卷的內(nèi)容效度? 是根據(jù)教育教學特性編制的,由評價指標、指標權(quán)重和評價標準等構(gòu)成的工具。 8、什么是教育測量?什么是教育評價? 教育測量是針對學校教育影響下學生各方面的發(fā)展,側(cè)重于量的規(guī)定性予以確定和描述的過程;教育評
19、價是按照一定的價值標準和教育目標,利用測量和非測量的種種方法系統(tǒng)地收集資料信息,對學生的發(fā)展變化及其影響學生發(fā)展變化的各種要素進行價值分析和價值判斷,并為教育決策提供依據(jù)的過程。 9、按解釋結(jié)果的參照點分類,教育測量與評價可分為哪幾類?并具體解釋一下。 常模參照測量與評價、標準參照測量與評價和潛力參照測量與評價。 常模參照測量與評價是將被試的水平與測驗常模相比較,以評價被試在團體中的相對位置的一種測量與評價類型;標準參照測量與評價是將被試的表現(xiàn)與既定的教育目標和行為標準相比較,以評價被試在多大程度上達到該標準的一種測量與評價;潛力參照測量與評價是將被試實際水平與其自身潛在水平相比較,以評
20、價其有無充分發(fā)揮自身潛力為目的。 10.簡述深刻理解教育測量必須抓住的三個要點。 答:(1)測量的結(jié)果就是給所測對象在一定性質(zhì)的量尺上指定值; (2)要達到這個目的就要按一定規(guī)則來進行一系列工作; (3)工作如何進行和能在什么性質(zhì)量尺上指定值,歸根到底取決于所測對象本身的性質(zhì)。 11.舉例說明什么是絕對評分分數(shù)。 答:教育工作是一種有組織有目的的活動,要努力追求教育目標的達成。所以,在學校里拿被試在測試上的測值,去跟所測特性的應(yīng)有標準作比較的事是很多的。很顯然,這時測驗分數(shù)的意義,就完全取決于實得測值與應(yīng)有標準的關(guān)系了。如果達到了要求,就是“合格”的或“已達標”的;如果未達到要求
21、,就是“不合格”或“未達標”的。這里,全然不管其他被試在同一測驗上所得測值如何,他們達標與否絲毫不影響被試測驗分數(shù)意義的確定。這種通過拿被試測值跟應(yīng)有標準作比較來確定其意義的分數(shù),就叫絕對評分分數(shù)。 12.簡述影響Ⅱ型錯誤的主要因素。 答:影響Ⅱ型錯誤概率大小的因素有三個, (1)第一個因素是客觀的真值與假設(shè)的偽值兩者之間的差異。 (2)影響Ⅱ型錯誤概率大小的第二個因素是a值的大小。 (3)影響Ⅱ型錯誤概率大小的第三個因素是樣本容量。 四、計算題(需寫出詳細計算過程) 1采用兩端組法確定考試題目的區(qū)分度和難度,假定37名學生參加考試,其中10名(占總?cè)藬?shù)37名的27%)高分組
22、學生和10名低分組學生在最后一道論述題(滿分值W=12分)上的得分如附表所示,試計算該題目的區(qū)分度和難度。[區(qū)分度D=PH—PL;難度D=(PH+PL)/2] 表2:高分組與低分組論述題得分統(tǒng)計表 高分組 10 7 9 9 8 9 6 10 9 10 低分組 4 6 2 3 5 1 0 4 7 6 區(qū)分度D=PH—PL=0.725-0.32=0.405;難度D=(PH+PL)/2=(0.725+0.32)/2=0.52 2已知某選拔考試參加人數(shù)為1000人,成績呈正態(tài)分布,平均分為75,標準差為10。 ⑴若只能有100人進入面試,
23、問面試分數(shù)線定多少合適? ⑵若有人考了65分,問該人在團體中處于什么位置(百分等級是多少)? 解:由題意可知求點雙列相關(guān) n=10,p=6/10,q=4/10, P=(75+57+73+65+63+67)/6=66.67, q =(67+56+61+65)/4=62.25 SΧ=5.8 rpb=(P -q)/Sx=(66.67-62.25)/5.8√0.60.4=0.372 所以區(qū)分度不明顯。 3采用兩端組法確定考試題目的區(qū)分度和難度,假定52名學生參加考試,其中14名(占總?cè)藬?shù)52名的27%)高分組學生和14名低分組學生在最后一道論述題(滿分值W=10分)
24、上的得分如附表所示,試計算該題目的區(qū)分度和難度。[區(qū)分度D=PH—PL;難度D=(PH+PL)/2] 高分組(14人) 10 7 9 9 8 9 6 10 8 8 8 9 10 8 低分組(14人) 4 6 2 3 5 1 0 4 3 2 0 7 6 3 區(qū)分度D=PH—PL=0.85-0.33=0.52;難度D=(PH+PL)/2=(0.85+0.33)/2=0.59 4某次考試中選擇題與總考試成績?nèi)缦卤?求該選擇題的區(qū)分度。 (教育測量學中試題的區(qū)分度以題目得分與試卷總分的相關(guān)系數(shù)表示) 考生 A B C D
25、E F G H I J 選擇題得分 1 1 1 1 0 0 1 0 0 1 總成績 75 57 73 65 67 56 63 61 65 67 (公式:) 解:由題意可知求點雙列相關(guān) n=10,p=6/10,q=4/10, P=(75+57+73+65+63+67)/6=66.67, q =(67+56+61+65)/4=62.25 SΧ=5.8 rpb=(P -q)/Sx=(66.67-62.25)/5.8√0.60.4=0.372 所以選擇題區(qū)分度0.372。 5某次高考模擬試卷高一的5名學生做所用時間分
26、別為170、120、110、160、130分鐘;高三的5名學生做所用時間分別為50、70、90、55、45分鐘;問高一和高三哪一組離散程度大? 解: 所以高三學生離散程度大。 6教育測量學中試題的區(qū)分度以題目得分與試卷總分的相關(guān)系數(shù)表示,下表是一次測驗的有關(guān)數(shù)據(jù): 考生 A B C D E F G H I J 第一題 1 1 1 1 0 0 1 0 0 1 被試得分 75 57 73 65 67 56 63 61 65 67 已知第一題為選擇題,試求其區(qū)分度。 (公式:)
27、 解:由題意可知求點雙列相關(guān) n=10,p=6/10,q=4/10, P=(75+57+73+65+63+67)/6=66.67, q =(67+56+61+65)/4=62.25 SΧ=5.8 rpb=(P -q)/Sx=(66.67-62.25)/5.8√0.60.4=0.372 所以區(qū)分度不明顯。 7某市舉行選拔考試,共1000人參加,已知此次考試平均分為60分,標準差為10,問 (1) 如果只錄取100人,那么錄取分數(shù)線定為多少合適? (2)如果某人考了70分,但只能有150人參加面試,問該人是否能進入面試? 解:根據(jù)標準分數(shù)公式 ⑴
28、 面試分數(shù)線為72.8 ⑵Z=1,P=0.34134 面試人比例為50%-34.134%=15.866%;159人。 不能進入面試 五假設(shè)檢驗 1男女生各一組參加某推理測驗,已知該測驗呈正態(tài)分布且總體方差相等。男生15人,平均分和標準差分別為82和9;女生13人,平均分和標準差分別為85和11。問男女生在該測驗得分有無顯著差異? (a=0.05,自由度為26時,t的臨界值為2.056) [ 檢驗統(tǒng)計量:] 附表1: 正態(tài)分布表: Z Y P Z Y P 0 0.39894 0.00000 1.07 0.22506 0.35769
29、0.21 0.39024 0.08317 1.28 0.17585 0.39973 0.25 0.38667 0.09871 1.29 0.17360 0.40147 0.26 0.38568 0.10257 1.96 0.05844 0.47500 1 0.24197 0.34134 2 0.05399 0.47725 2對男女大學生進行某測試(已知該測試成績服從正態(tài)分布且總體方差相等)其結(jié)果如下,試在=0.05顯著水平上檢驗?zāi)信谠摐y試上是否存在顯著的差異。 n 平均數(shù) 方差 男 生 女 生 13 15
30、85 82 11 9 (a=0.05,自由度為26時,t的臨界值為2.056) [ 檢驗統(tǒng)計量:] 附表1: 正態(tài)分布表: Z Y P Z Y P 0 0.39894 0.00000 1 0.24197 0.34134 0.10 0.39695 0.03983 1.07 0.22506 0.35769 0.21 0.39024 0.08317 1.28 0.17585 0.39973 0.25 0.38667 0.09871 1.29 0.17360 0.40147 0.26 0.38568 0.102
31、57 1.96 0.05844 0.47500 0.5 0.35207 0.19146 2 0.05399 0.47725 五、 1、解:①提出假設(shè)H0 : μ1 = μ2 H1 : μ1 ≠ μ2 ② ③根據(jù)顯著性水平查表確定臨界值t=2.056 ④比較統(tǒng)計量與臨界值可知未落入危機域,所以男女學生在測驗上得分無顯著差異。 2、解: ①作假設(shè): H0:μ1=μ2,H1:μ1≠μ2 ②統(tǒng)計量 ③已知α=0.05,查表得t0.05/2(26)=2.056 ④比較,所以接受原假設(shè),所以沒有差異。 專心---專注---專業(yè)
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。