《心理測(cè)量學(xué)真分?jǐn)?shù)與信度和效度.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《心理測(cè)量學(xué)真分?jǐn)?shù)與信度和效度.ppt(19頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、真分?jǐn)?shù)與信度/效度,上傳 劉景波(snr5aliu) 目的 僅用于學(xué)習(xí)交流,心理測(cè)量的誤差種類,誤差定義,誤差是由測(cè)量中與目的無(wú)關(guān)的因素引起的不準(zhǔn)確或不一致的效應(yīng)。 心理學(xué)研究中的誤差按其性質(zhì)可分為三類, 隨機(jī)誤差系統(tǒng)誤差過(guò)失誤差 (恒定誤差),心理學(xué)研究中的三類誤差,隨機(jī)誤差 又稱偶然誤差。由實(shí)驗(yàn)中一些偶然因素引起又不可控制的誤差。隨機(jī)誤差產(chǎn)生的原因十分復(fù)雜,但其存在是絕對(duì)的。 隨著實(shí)驗(yàn)觀測(cè)次數(shù)的增加,隨機(jī)誤差的變化會(huì)呈現(xiàn)一定的規(guī)律性它總是圍繞被觀測(cè)的真正值(又稱真分?jǐn)?shù),一般用多次觀測(cè)的平均值來(lái)表示,真正值是無(wú)法測(cè)量到的)波動(dòng),隨機(jī)誤差的算術(shù)平均數(shù)隨著觀測(cè)次數(shù)的增加而逐漸減少以
2、至于趨近于零。 系統(tǒng)誤差 就是觀測(cè)過(guò)程中服從確定規(guī)律性的誤差。由于實(shí)驗(yàn)條件不同,造成不同的有一定規(guī)律性的誤差屬于這類誤差。心理學(xué)實(shí)驗(yàn)中,不同的實(shí)驗(yàn)方法、不同的被試樣本等都會(huì)對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生規(guī)律性的影響。這類誤差不能通過(guò)增加實(shí)驗(yàn)次數(shù)消除。如果需要可以通過(guò)實(shí)驗(yàn)設(shè)計(jì)加以消除,這一問(wèn)題我們將在后邊的變量處理和實(shí)驗(yàn)設(shè)計(jì)中討論。 過(guò)失誤差 一般把明顯歪曲實(shí)驗(yàn)結(jié)果的誤差成為過(guò)失誤差,它是由于實(shí)驗(yàn)觀測(cè)過(guò)程中的過(guò)失造成的。這些錯(cuò)誤有測(cè)錯(cuò)、傳錯(cuò)、記錯(cuò)、儀器失靈、取樣錯(cuò)誤。在實(shí)驗(yàn)數(shù)據(jù)整理過(guò)程中必須鑒別、舍棄這些含有過(guò)失誤差的數(shù)據(jù)(又稱異常點(diǎn)),否則會(huì)嚴(yán)重影響實(shí)驗(yàn)結(jié)果的準(zhǔn)確性,得出不正確的結(jié)論。,心理測(cè)量誤差的三方面來(lái)
3、源,在心理測(cè)量中,常見(jiàn)的誤差來(lái)源于三個(gè)方面: 測(cè)驗(yàn)內(nèi)部,施測(cè)過(guò)程,受測(cè)者本身。,1測(cè)驗(yàn)內(nèi)部引起的誤差,測(cè)驗(yàn)內(nèi)部的誤差主要來(lái)源于題目取樣: 、當(dāng)測(cè)驗(yàn)題目較少或取樣缺乏代表性時(shí),被試的反應(yīng)受機(jī)遇影響較大(譬如一次考試碰巧準(zhǔn)備到或沒(méi)有準(zhǔn)備到某題);當(dāng)幾個(gè)測(cè)驗(yàn)復(fù)本不等值時(shí),接受不同的題目,就會(huì)獲得不同的分?jǐn)?shù)。 、除題目取樣不當(dāng)可引起誤差外,其他一些因素,如題目用詞的模棱兩可,對(duì)反應(yīng)步驟說(shuō)得不清楚;題目過(guò)難引起猜測(cè);時(shí)限短使被試倉(cāng)促做答等,也可能成為誤差的來(lái)源。,2由施測(cè)過(guò)程引起的誤差,在三種誤差來(lái)源中,與施測(cè)過(guò)程有關(guān)的誤差可能是最容易控制和檢驗(yàn)的。測(cè)驗(yàn)的標(biāo)準(zhǔn)化水平越來(lái)越高,大部分施測(cè)條件能夠得到控制。
4、但由于心理現(xiàn)象的復(fù)雜性,許多意想不到的偶然因素仍可能影響測(cè)驗(yàn)分?jǐn)?shù),使人防不勝防。 、物理環(huán)境 施測(cè)現(xiàn)場(chǎng)的溫度、光線、聲音、桌面好壞、空間闊窄等皆具有影響。 、主試者方面 主試者的年齡、性別、外表,施測(cè)時(shí)的言談舉止、表情動(dòng)作等均能影響測(cè)驗(yàn)結(jié)果。倘若不存在按照規(guī)定實(shí)施測(cè)驗(yàn),如制造緊張氣氛,給予特別協(xié)助貨暗示,以及計(jì)時(shí)錯(cuò)誤等,都會(huì)帶來(lái)較大誤差。特別是當(dāng)測(cè)驗(yàn)具有復(fù)雜步驟和說(shuō)明,或測(cè)驗(yàn)題目本身是模糊不確定的形式時(shí);當(dāng)主試者在安排測(cè)驗(yàn)條件上有較多余地(例如個(gè)別實(shí)施)測(cè)時(shí);當(dāng)測(cè)驗(yàn)是對(duì)幼兒、有情緒困擾者以及對(duì)測(cè)驗(yàn)程序不熟悉的人施測(cè)時(shí),主試者的影響更大。 、意外干擾 在測(cè)驗(yàn)環(huán)境復(fù)雜,特別是當(dāng)受試人數(shù)較多時(shí),容易
5、發(fā)生出乎意料的干擾或分心事件。例如:停電、有人生病、有人作弊、計(jì)時(shí)表停了、臨時(shí)發(fā)現(xiàn)題目或作答紙張印刷不清或裝訂錯(cuò)誤等,無(wú)論哪種情況都會(huì)引起不安和擾亂,導(dǎo)致成績(jī)不準(zhǔn)確、不一致。 、評(píng)分計(jì)分 評(píng)分不客觀以及計(jì)算登記分?jǐn)?shù)出錯(cuò)也是常見(jiàn)的誤差。一般選擇題的評(píng)分教為客觀。而問(wèn)答題、論文題等自由反應(yīng)型的題目,評(píng)分標(biāo)準(zhǔn)很難掌握,加之閱卷者的偏好個(gè)不相同,因而難以保證分?jǐn)?shù)的一致性。不僅各教師間有此差異,即使是同一教師一次評(píng)許多卷,受情緒疲勞、外界干擾、卷面整潔、考試前后位置引起的對(duì)比效應(yīng)以及對(duì)學(xué)生成見(jiàn)的影響,標(biāo)準(zhǔn)也可能不統(tǒng)一,甚至同一張?jiān)嚲砀粢欢问录僭u(píng),前后給分也可能不一致。至于學(xué)校間、地區(qū)間的差別就更大了。
6、 為了控制與施測(cè)過(guò)程有關(guān)的誤差,主試者必須嚴(yán)格遵循標(biāo)準(zhǔn)化程序施測(cè)和評(píng)分,不得任意改動(dòng)和發(fā)揮,同時(shí)要機(jī)智地處理各種意外情況。,真分?jǐn)?shù)理論 真分?jǐn)?shù)是一個(gè)在理論上構(gòu)想出來(lái)的概念,真分?jǐn)?shù):一個(gè)測(cè)量工具在沒(méi)有測(cè)量誤差時(shí),所得到的真正值。 真分?jǐn)?shù)的操作定義:經(jīng)過(guò)無(wú)數(shù)次測(cè)量所得的平均值。 真分?jǐn)?shù)的定義表明,一個(gè)人在一個(gè)測(cè)驗(yàn)上所得的分?jǐn)?shù),是他的真分?jǐn)?shù)的函數(shù),也是測(cè)量誤差的函數(shù),用公式表示如下: X=T+E 這里X為實(shí)得分?jǐn)?shù)或觀測(cè)分?jǐn)?shù),T是假設(shè)的真分?jǐn)?shù),E是測(cè)量誤差。,X=T+E 這里X為實(shí)得分?jǐn)?shù)或觀測(cè)分?jǐn)?shù), T是假設(shè)的真分?jǐn)?shù),E是測(cè)量誤差。 E僅指隨機(jī)誤差,不包括系統(tǒng)誤差(I),后者不引起分?jǐn)?shù)的改變,因
7、而包含在真值中。 即,T=V+I,誤差與真分?jǐn)?shù)、和實(shí)得分?jǐn)?shù)的關(guān)系,在公式3-1中,E可能是正的,也可能是負(fù)的。這就是說(shuō),一個(gè)人的實(shí)得分?jǐn)?shù)可能大于真實(shí)量,也可能小于真實(shí)量,總是圍繞著真值上下波動(dòng)。 關(guān)于測(cè)量誤差(E)有以下假設(shè): (1)如果對(duì)一個(gè)人測(cè)量無(wú)數(shù)次,其平均誤差為0, 即E0 (2)真分?jǐn)?shù)和測(cè)量誤差是相互獨(dú)立的, 即 rTE0 (3)誤差分?jǐn)?shù)和實(shí)得分?jǐn)?shù)的相關(guān)為0, 即 rXE0,真分?jǐn)?shù)理論 與 信度 效度,實(shí)得分?jǐn)?shù)(X)中的變異,(SX2)實(shí)得分?jǐn)?shù)變異 (ST2)真分?jǐn)?shù)的變異 (SV2)有效變異數(shù) (SE2)隨機(jī)誤差變異 (SI2)系統(tǒng)誤差變異,(ST2SX2)測(cè)驗(yàn)的信度 (SV2SX2
8、)測(cè)驗(yàn)的效度,效度和效度的定義,信度和效度的關(guān)系,信度(ST2SX2) 當(dāng)隨機(jī)誤差的變異(SE2)減少時(shí),真分?jǐn)?shù)的變異(ST2)增加,測(cè)驗(yàn)的信度隨之提高。,效度(SV2 SX2) 信度的提高只給有效變異數(shù)(SV2)的增加提供可能。 至于是否能提高效度,還要看系統(tǒng)誤差(SI2)的大小。 可見(jiàn),信度高不一定效度高。但一個(gè)測(cè)驗(yàn)要想效度高,真分?jǐn)?shù)的變異必須占較大的比重,即測(cè)驗(yàn)的信度必須高。,信度效度關(guān)系的數(shù)學(xué)表達(dá),rXY表示實(shí)得效度系數(shù)(程序X得分與外部效標(biāo)Y分?jǐn)?shù)之間的相關(guān)),rXX表示測(cè)量程序的信度。式中顯示:信度是效度的極限值或上限。換言之,由于測(cè)量的不可信而降低了效度。,但是,在一些效標(biāo)或預(yù)測(cè)因子中存在某種程度的不可信是不可避免的。當(dāng)效標(biāo)的信度已知,可以用左面的公式在統(tǒng)計(jì)上對(duì)這種不可信進(jìn)行校正:,3信度指數(shù)和信度系數(shù),