《《心理測量》測量的效度(45P)》由會員分享,可在線閱讀,更多相關(guān)《《心理測量》測量的效度(45P)(45頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、測量的效度測量的效度案例一 美國杜克能源公司某蒸氣站被美國杜克能源公司某蒸氣站被12名黑人雇名黑人雇工告上了法庭,緣由是該公司把他們都當勤雜工告上了法庭,緣由是該公司把他們都當勤雜工使用,每天的任務(wù)就是掃地和清潔,他們原工使用,每天的任務(wù)就是掃地和清潔,他們原本指望能被提升到像運煤工這樣層次更高的崗本指望能被提升到像運煤工這樣層次更高的崗位上,但公司說他們的智力測驗分數(shù)不夠,而位上,但公司說他們的智力測驗分數(shù)不夠,而該公司的該公司的14個黑人員工中有個黑人員工中有13個做勤雜工,訴個做勤雜工,訴訟的理由是智力測驗有種族歧視。而公司說沒訟的理由是智力測驗有種族歧視。而公司說沒有任何歧視,崗位安排
2、完全根據(jù)測驗結(jié)果來定有任何歧視,崗位安排完全根據(jù)測驗結(jié)果來定,沒有歧視黑人。,沒有歧視黑人。 法庭要求公司提供測驗對職位勝任的預(yù)測力法庭要求公司提供測驗對職位勝任的預(yù)測力。案例二 某大學(xué)學(xué)生期終考試后向校方提出質(zhì)疑,某大學(xué)學(xué)生期終考試后向校方提出質(zhì)疑,說教授給出的考試范圍是教科書中的說教授給出的考試范圍是教科書中的110章章,但考試內(nèi)容卻都集中于前三章,這樣的考試,但考試內(nèi)容卻都集中于前三章,這樣的考試無法檢驗真實的學(xué)習(xí)成績,也就是考試并沒有無法檢驗真實的學(xué)習(xí)成績,也就是考試并沒有提供一個讓我展現(xiàn)所學(xué)全部知識的機會。提供一個讓我展現(xiàn)所學(xué)全部知識的機會。第一節(jié)第一節(jié) 效度概述效度概述定義定義:
3、測驗達到測量的目的測驗達到測量的目的,即測到了即測到了要想測量的對象要想測量的對象. 效度反應(yīng)了測驗的準確性效度反應(yīng)了測驗的準確性 與目的有關(guān)的真分數(shù)在實測分數(shù)中所占的比例與目的有關(guān)的真分數(shù)在實測分數(shù)中所占的比例 (在實測分數(shù)中有效真分數(shù)所占的比率在實測分數(shù)中有效真分數(shù)所占的比率) 實測分數(shù)實測分數(shù)=真分數(shù)真分數(shù)+誤差誤差(隨機誤差隨機誤差) 與目的與目的 與目的與目的 有關(guān)有關(guān) 無關(guān)無關(guān)(系統(tǒng)誤差系統(tǒng)誤差)一個穩(wěn)定但無效的智力測驗一個穩(wěn)定但無效的智力測驗 1. 你出生在幾月份? 2. 你母親姓什么? 3. 1+1=? 4. 一個星期有幾天? 5. 下面哪個是三角形? A. B. C.信度與效
4、度的關(guān)系信度與效度的關(guān)系 信度是效度的必要條件信度是效度的必要條件,但不是充但不是充分條件分條件.要想一個測驗的效度高要想一個測驗的效度高,其信度其信度必須得高;但信度高必須得高;但信度高,效度未必高效度未必高.影響效度的誤差來源影響效度的誤差來源1.測驗題目不能反應(yīng)要測量的特征測驗題目不能反應(yīng)要測量的特征.2. 實施過程偏離了標準化的程序?qū)嵤┻^程偏離了標準化的程序.3. 被試不能如實回答被試不能如實回答.測驗效度的類型測驗效度的類型 效標效度效標效度 內(nèi)容效度內(nèi)容效度 結(jié)構(gòu)效度結(jié)構(gòu)效度第二節(jié)第二節(jié) 效標效度效標效度(準則關(guān)聯(lián)效度準則關(guān)聯(lián)效度)什么是效標什么是效標: 反應(yīng)測驗?zāi)康牡男袨閰⒄辗磻?yīng)
5、測驗?zāi)康牡男袨閰⒄?什么是效標效度什么是效標效度: 測驗分數(shù)與效標行為間的一致性測驗分數(shù)與效標行為間的一致性程度程度 理想效標的四大條件理想效標的四大條件1. 有效性有效性2. 可靠性可靠性3. 可操作性可操作性4. 實用性實用性預(yù)測性和同時性效度預(yù)測性和同時性效度 預(yù)測性效度:測驗分數(shù)和以后的某個效標之間預(yù)測性效度:測驗分數(shù)和以后的某個效標之間的相關(guān)的相關(guān) 同時性效度:同時獲得測驗分數(shù)和某個效標之同時性效度:同時獲得測驗分數(shù)和某個效標之間的相關(guān)間的相關(guān)七種效標類型七種效標類型安娜斯塔西的分類安娜斯塔西的分類(1977)學(xué)業(yè)成績學(xué)業(yè)成績特殊訓(xùn)練課程成績特殊訓(xùn)練課程成績實際工作表現(xiàn)實際工作表現(xiàn)對
6、照組對照組精神病診斷精神病診斷評定評定先前已有的測驗先前已有的測驗效標效度的計算方法效標效度的計算方法1. 相關(guān)法相關(guān)法 求取測驗分數(shù)與效標變量之間的求取測驗分數(shù)與效標變量之間的相關(guān)程度相關(guān)程度,即效度系數(shù)即效度系數(shù). 1) 積差相關(guān)積差相關(guān) 在兩組數(shù)據(jù)都是連續(xù)變量在兩組數(shù)據(jù)都是連續(xù)變量,且兩者存在線性關(guān)且兩者存在線性關(guān)系時使用系時使用公式公式:被被 試試12345678910測驗測驗(x)20343247202427252216銷售額銷售額(y)2.53.8340.712.23.52.81.22) 二列相關(guān)二列相關(guān) 在測驗分數(shù)和效標這兩個變量中一個是連在測驗分數(shù)和效標這兩個變量中一個是連續(xù)變
7、量續(xù)變量,另一個是二分變量時使用另一個是二分變量時使用.公式公式:例例: 智商與學(xué)校類型的關(guān)系智商與學(xué)校類型的關(guān)系p 重點中學(xué)被試百分比重點中學(xué)被試百分比 66/352 = 0.1875q 普通中學(xué)被試百分比普通中學(xué)被試百分比 286/352 = 0.8125 重點中學(xué)被試智商均數(shù)重點中學(xué)被試智商均數(shù) 114 普通中學(xué)被試智商均數(shù)普通中學(xué)被試智商均數(shù) 96St 總體標準差總體標準差 14.53y 常態(tài)曲線下,常態(tài)曲線下,p 所對應(yīng)的縱軸高度所對應(yīng)的縱軸高度 0.26853) 多元相關(guān)多元相關(guān) 在測驗分數(shù)和效標變量中有一個是連續(xù)變量在測驗分數(shù)和效標變量中有一個是連續(xù)變量,另一個是二分以上的變量時
8、使用另一個是二分以上的變量時使用. 用用Juspen公式公式4) 等級相關(guān)等級相關(guān)(spearmans rho) 在兩組變量都是等級時使用在兩組變量都是等級時使用 用斯皮爾曼等級相關(guān)系數(shù)用斯皮爾曼等級相關(guān)系數(shù). 5) 四格相關(guān)四格相關(guān) 在兩組變量都是二分變量且都是人為的時使用在兩組變量都是二分變量且都是人為的時使用. 用皮爾遜余弦用皮爾遜余弦 法法. 如兩組變量都是二分變量如兩組變量都是二分變量,但至少其中的一組但至少其中的一組是真實的二分法時用是真實的二分法時用phi相關(guān)相關(guān) 二二.區(qū)分法區(qū)分法 以被試在效標上的表現(xiàn)分組以被試在效標上的表現(xiàn)分組,然后再對兩組然后再對兩組被試在測驗中的成績用被
9、試在測驗中的成績用t值進行顯著性差異的檢值進行顯著性差異的檢驗驗.公式公式:區(qū)分法的缺點是如果樣本規(guī)模大區(qū)分法的缺點是如果樣本規(guī)模大的時候的時候,沒有顯著性也能算出顯著性差沒有顯著性也能算出顯著性差異來異來,所以要配合重疊量的使用所以要配合重疊量的使用.1. 以稱職組的平均數(shù)為指標以稱職組的平均數(shù)為指標,看兩組中超過這一看兩組中超過這一平均數(shù)的人次百分比平均數(shù)的人次百分比.比例越低說明差異越大比例越低說明差異越大,如如稱職組的平均數(shù)為稱職組的平均數(shù)為6.05,不稱職組超過此分數(shù)的有不稱職組超過此分數(shù)的有7人人,稱職組超過這一分數(shù)的有稱職組超過這一分數(shù)的有38人人,人次比為人次比為7/38,重疊
10、的部分為重疊的部分為18%,差異很大差異很大.2. 統(tǒng)計稱職組中分數(shù)低于不稱職組平均數(shù)的人數(shù)統(tǒng)計稱職組中分數(shù)低于不稱職組平均數(shù)的人數(shù),和不稱職組中分數(shù)高于稱職組平均數(shù)的人數(shù)和不稱職組中分數(shù)高于稱職組平均數(shù)的人數(shù).然然后兩數(shù)相加后兩數(shù)相加,再除以總?cè)藬?shù)再除以總?cè)藬?shù).如如:稱職組稱職組20人人,不稱職不稱職組組20人人,不稱職組中分數(shù)超過稱職組平均數(shù)的有不稱職組中分數(shù)超過稱職組平均數(shù)的有7人人,稱職組中分數(shù)低于不稱職組平均數(shù)的有稱職組中分數(shù)低于不稱職組平均數(shù)的有3人人,那么那么 有有25%的重疊部分的重疊部分.3. 算出兩組人分數(shù)分布共同區(qū)域的百分率算出兩組人分數(shù)分布共同區(qū)域的百分率,即重疊的區(qū)域
11、即重疊的區(qū)域,如重疊區(qū)域越大如重疊區(qū)域越大,說明差異越說明差異越小小,而重疊小說明測驗有效而重疊小說明測驗有效.3. 命中率命中率測驗有效性的指標之一就是作出正確決定的測驗有效性的指標之一就是作出正確決定的比率比率,即決策的命中率即決策的命中率. 效標成績效標成績測驗預(yù)測測驗預(yù)測失敗失敗成功成功成功成功( A ) 失誤失誤( B ) 命中命中失敗失敗( C ) 命中命中( D ) 失誤失誤第三節(jié)第三節(jié) 內(nèi)容效度內(nèi)容效度定義定義: 測驗題目對所要測量的內(nèi)容范測驗題目對所要測量的內(nèi)容范圍的代表性程度,考驗題目樣本圍的代表性程度,考驗題目樣本是否代表了內(nèi)容總體是否代表了內(nèi)容總體。內(nèi)容效度的兩個要點內(nèi)
12、容效度的兩個要點1. 測題對測量對象的有效性測題對測量對象的有效性2. 全部測題對測量對象的涵蓋程度全部測題對測量對象的涵蓋程度例子例子對一個優(yōu)秀籃球運動員技能的測量對一個優(yōu)秀籃球運動員技能的測量測量目的測量目的: 一個優(yōu)秀籃球運動員需要具備的技能一個優(yōu)秀籃球運動員需要具備的技能對內(nèi)容領(lǐng)域的描述對內(nèi)容領(lǐng)域的描述: 投藍,運球,搶籃板。投藍,運球,搶籃板。測驗測驗A: 在各個位置上投藍在各個位置上投藍40次次;測驗測驗B: 各種情景下的運球各種情景下的運球30次次.確定內(nèi)容效度的方法確定內(nèi)容效度的方法專家判斷專家判斷 請某領(lǐng)域里的專家來評判測驗的內(nèi)容是請某領(lǐng)域里的專家來評判測驗的內(nèi)容是否編排的合
13、理否編排的合理.缺點缺點: 1) 沒有量化指標沒有量化指標; 2) 對內(nèi)容效度的判斷不一致對內(nèi)容效度的判斷不一致; 3) 教育思想或心理學(xué)觀點不同教育思想或心理學(xué)觀點不同,所以對內(nèi)容范所以對內(nèi)容范圍的理解也不同圍的理解也不同.內(nèi)容效度比(內(nèi)容效度比(CVR) 內(nèi)容效度比低的題目就應(yīng)該被淘汰內(nèi)容效度比低的題目就應(yīng)該被淘汰.然后計算然后計算全部測題的內(nèi)容效度比的平均數(shù)全部測題的內(nèi)容效度比的平均數(shù),作為內(nèi)容效度作為內(nèi)容效度的指標的指標.其他輔助的方法其他輔助的方法2.統(tǒng)計分析法統(tǒng)計分析法3.再測法再測法4.經(jīng)驗法經(jīng)驗法5.內(nèi)在一致性內(nèi)在一致性內(nèi)容效度與表面效度的區(qū)別內(nèi)容效度與表面效度的區(qū)別表面效度是
14、指測驗看起來所要測量的表面效度是指測驗看起來所要測量的東西東西,是被試或外行看來是有效的測驗是被試或外行看來是有效的測驗.表面效度與內(nèi)容效度并不總是一致的表面效度與內(nèi)容效度并不總是一致的.表面效度能間接影響測驗的效度表面效度能間接影響測驗的效度,所以所以測驗編制時也要適當關(guān)注表面效度測驗編制時也要適當關(guān)注表面效度.提高內(nèi)容效度的有效方法:提高內(nèi)容效度的有效方法: 編制命題的雙向細目表編制命題的雙向細目表記憶記憶了解了解應(yīng)用應(yīng)用分析分析綜合綜合評價評價合計合計第一章第一章8210第二章第二章12621030第三章第三章4422618第四章第四章2101284642合計合計626281420610
15、0第四節(jié)第四節(jié) 結(jié)構(gòu)效度結(jié)構(gòu)效度定義定義: 測驗?zāi)軌驕y量到理論上的結(jié)構(gòu)或測驗?zāi)軌驕y量到理論上的結(jié)構(gòu)或特質(zhì)的程度特質(zhì)的程度.某一智力理論的四項假設(shè)某一智力理論的四項假設(shè):1.智力隨年齡而增長智力隨年齡而增長;2.智商是穩(wěn)定的智商是穩(wěn)定的;3.智力與學(xué)業(yè)成績有密切關(guān)系智力與學(xué)業(yè)成績有密切關(guān)系;4.智力受遺傳的影響智力受遺傳的影響.某注意力的理論某注意力的理論,注意有如下特征注意有如下特征:1.穩(wěn)定性穩(wěn)定性2.集中性集中性3.轉(zhuǎn)移性轉(zhuǎn)移性4.分配分配5.范圍范圍收集結(jié)構(gòu)效度資料的方法收集結(jié)構(gòu)效度資料的方法1.測驗內(nèi)方法測驗內(nèi)方法 研究測驗的內(nèi)部構(gòu)造來界定所測量的結(jié)研究測驗的內(nèi)部構(gòu)造來界定所測量的結(jié)構(gòu)范圍構(gòu)范圍. 1) 內(nèi)容效度內(nèi)容效度 2) 內(nèi)在一致性內(nèi)在一致性 3) 因素分析因素分析2. 測驗間方法測驗間方法 研究幾個同類測驗間的相互關(guān)系來考研究幾個同類測驗間的相互關(guān)系來考察它們是否測量相同的心理結(jié)構(gòu)察它們是否測量相同的心理結(jié)構(gòu). 1)相容效度相容效度 2) 會聚效度和區(qū)分效度會聚效度和區(qū)分效度3. 發(fā)展變化發(fā)展變化4. 實驗操作實驗操作5. 結(jié)構(gòu)方程建模結(jié)構(gòu)方程建模