心理咨詢師基礎(chǔ)知識總結(jié)-心理測量學.doc
《心理咨詢師基礎(chǔ)知識總結(jié)-心理測量學.doc》由會員分享,可在線閱讀,更多相關(guān)《心理咨詢師基礎(chǔ)知識總結(jié)-心理測量學.doc(13頁珍藏版)》請在裝配圖網(wǎng)上搜索。
心理測量學知識總結(jié) 測量與測量量表 一、什么是測量 對測量的描述正確的是,測量就是依據(jù)一定的法則用數(shù)字對事物加以確定。 測量的元素包括:①法則;②數(shù)字;③事物。 測量所用數(shù)字具有自然數(shù)的特點,即具有:①區(qū)分性;②等級性;③等距性;④可加性。 二、測量要素 任何測量都應(yīng)該具備的要素是:①參照點;②單位。 (一)參照點:參照點就是確定事物的量時,計算的起點。參照點有兩種,即:①絕對零點;②相對零點。參照絕對零點可加減乘除,參照相對零點只能加減(心理測量參照相對零點)。 (二)單位:好的單位必須具備兩個條件:①確定的意義;②相同的價值。心理現(xiàn)象既沒有確定的意義,也沒有相同的價值。心理測驗的結(jié)果是有誤差的,要用區(qū)間來解釋,而不是用點來解釋。 三、測量量表 定義:在一個定有單位和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來,這個連續(xù)體稱為量表。 斯蒂文斯(S.S.Stevens)將測量從低級到高級分成4種水平:①命名量表;②順序量表;③等距量表;④等比量表。 (一)命名量表:是測量水平最低的量表形式,只是用數(shù)字來代表事物或把事務(wù)歸類。用1代表男,用2代表女等等,這樣的量表通常叫命名量表。 (二)順序量表:比命名量表水平高,數(shù)字不僅指明類別,同時指明類別的大小或?qū)傩猿潭取N覀兺ǔW生的考試結(jié)果按名次排隊,這些名次屬于順序變量。在順序量表中,變量具有等級。 (三)等距量表:比順序量表進一步,有相等的單位,其數(shù)值可以相互做加減運算;但沒有絕對零點,因此不能做乘除運算。0℃并不意味著沒有溫度,這種說法對。 (四)等比量表:最高水平量表,有相等單位又有絕對零點,所得的數(shù)字可以做加減乘除運算。其數(shù)值可以進行加、減、乘、除運算的量表是等比變量。 一般說來,心理測量是在順序量表上進行的,主要用于分等級和排序。 斯蒂文斯的4種量表(水平從低到高) 水平 量表 屬 性 可進行 大小關(guān)系 相等單位 絕對零點 1 命名量表 無 無 無 標記和分類 2 順序量表 有 無 無 分等級和排序 3 等距量表 有 有 無 加減運算 4 等比量表 有 有 有 加減乘除運算 心理測驗概要 基本概念 一、心理測驗的定義 正確的說法是,心理測驗,就是依據(jù)心理學理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點做出推論和數(shù)量化分析的一種科學手段。 二、心理測驗的性質(zhì) 心理測驗具有獨特的性質(zhì),即具有:①間接性;②相對性;③客觀性。 相對性屬于心理測驗的重要性質(zhì)。 影響心理測量客觀性的要素是:①測驗刺激的客觀性;②對反應(yīng)的量化的客觀性;③對測驗結(jié)果的推論的客觀性。測驗的客觀性不包括絕對的標準的客觀性。 分類 一、按測驗的功能分類 按測驗的功能進行分類,可將測驗分為:①智力測驗;②特殊能力測驗;③人格測驗。 二、按測驗材料的性質(zhì)分類 按測驗材料的性質(zhì)分類,可將測驗分為:①文字測驗;②操作測驗。 三、按測驗材料的嚴謹程度分類 按測驗材料的嚴謹程度分類,可將測驗分為:①客觀測驗;②投射測驗。 刺激沒有明確意義,對被試反應(yīng)沒有明確規(guī)定的心理測驗,稱之為投射測驗。投射測驗的主要特點是刺激材料的意義是不明確的。 四、按測驗的方式分類 按測驗的方式分類,可將測驗分為:①個別測驗;②團體測驗。 團體測驗始于第一次世界大戰(zhàn),陸軍甲種和乙種智力測驗是第一個團體測驗。 五、按測驗的要求分類 按測驗的要求分類,可將測驗分為:①最高作為測驗;②典型行為測驗。 心理測驗的分類 分類原則 測驗種類 測驗實例 按功能分類 智力測驗 特殊能力測驗 人格測驗 比內(nèi)一西蒙智力測驗;斯坦福一比內(nèi)智力量表;韋氏兒童成人智力量表 升學、職業(yè)指導,特殊工種人員篩選,臨床較少 MMPI、16PF、EPQ、羅夏、主題統(tǒng)覺(TAT)(0308-3-191) 按材料性質(zhì)分類 文字測驗 操作測驗 MMPI、EPQ、16PF、韋氏智力量表中的言語量表 羅夏、TAT、瑞文測驗、韋氏智力量表中的操作量表 按材料嚴謹程度分類 客觀測驗 投射測驗 絕大多數(shù)心理測驗均屬此類 羅夏、主題統(tǒng)覺、自由聯(lián)想、句子完成 按方式分類 個別測驗 團體測驗 比內(nèi)一西蒙智力量表;韋氏智力量表;不能用于團體 陸軍甲種乙種測驗;教育成就測驗;團體測驗可個別實施,如MMPI、EPQ、16PF等 按要求分類 最高作為測驗 典型行為測驗 智力測驗、成就測驗均屬最高作為測驗 各種人格測驗均屬典型行為測驗 應(yīng)用 糾正錯誤的測驗觀 錯誤的測驗觀 錯誤的測驗觀包括:①測驗萬能論;②測驗無用論;③心理測驗即智力測驗。 錯誤的測驗觀不包括“以上一個也不是”。 正確的測驗觀 正確的測驗觀包括(習題137):①心理測驗是重要的心理學研究方法之一,是決策的輔助工具;②心理測驗作為研究方法和測量工具尚不完善。 在心理咨詢中的應(yīng)用 我國目前心理門診中運用較多的心理測驗有:①智力測驗;②人格測驗;③心理評定量表。 一、智力測驗 我國修訂后的韋氏智力量表包括:①WAIS-RC;②C-WISC;③C-WYCS1。 二、人格測驗 三、心理評定量表 歷史 一、科學心理測驗的產(chǎn)生與發(fā)展 英國生物學家和心理學家高爾登(F.Galton)的主要貢獻有:①提出人的不同氣質(zhì)特點和智能是按身體特點的不同而遺傳的;②為了研究差異的遺傳性,設(shè)計了測量差異的方法;③為心理測驗奠定了統(tǒng)計學基礎(chǔ),第一個提出了相關(guān)的概念。 美國心理學家卡特爾(J.M.Cattell)對促進心理測驗發(fā)展做出的巨大貢獻是:①使心理測驗首次出現(xiàn)于心理學文獻中;②認為心理學應(yīng)立足于實驗和測驗;③認為心理測驗應(yīng)有統(tǒng)一的標準。 比內(nèi)(A.Binet)編制了世界上第一個正式的心理測驗。 20世紀以后,心理測驗在如下幾方面取得了長足發(fā)展:①操作測驗;②團體智力測驗;③能力傾向測驗;④人格測驗。 20世紀在智力測驗方面的新發(fā)展是研發(fā)了:①羅夏測驗;②團體測驗;③操作測驗;④投射測驗(P335)。 有關(guān)心理測驗的發(fā)展史,正確的描述是中國的科舉制度是世界上較早的心理測驗的實踐。 二、現(xiàn)代心理測驗在我國的發(fā)展 近些年來,我國心理學家正在致力于心理測驗的本土化研究。 測驗指標 測驗常模 常模團體 一、常模團體的性質(zhì) 常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。 常模團體的選擇一般包括:①確定一般總體;②確定目標總體;③確定樣本。 二、常模團體的條件 常模團體的條件包括:①群體構(gòu)成的明確界定;②對群體具有代表性;③樣本量大小要適當;④具有新近性(標準化樣組是一定時空的產(chǎn)物)。抽樣方法不是常模團體的條件。 (一)群體的構(gòu)成必須明確界定 (二)常模團體必須是所測群體的代表性樣本 (三)樣本大小要適當 實際工作中,樣本量大小適當須從如下幾方面考慮:①經(jīng)濟;②實用;③減少誤差。 常模樣本量的大小,一般最低不小于30或 100。全國性常模,樣本量一般要在2000~3000之間。樣本大小適當?shù)年P(guān)鍵是樣本要有代表性。 (四)標準化樣組是一定時空的產(chǎn)物 三、取樣的方法 抽樣的方法一般有:①簡單隨機抽樣;②系統(tǒng)抽樣;③分組抽樣;④分層抽樣。 取樣是指從目標人群中選擇有代表性的樣本。 隨機號碼表法是簡單隨機抽樣。 系統(tǒng)抽樣要求:①目標總體無序可排;②無等級結(jié)構(gòu)存在。 系統(tǒng)抽樣法的關(guān)鍵是計算組距。 先將群體分組,再在組內(nèi)進行隨機取樣的方法是分組抽樣。 四、常模分數(shù)與常模 (一)常模分數(shù) 定義:常模分數(shù)就是施測常模樣本被試后,將被試者的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導出分數(shù)。 常模分數(shù)又叫導出分數(shù)。 導出分數(shù)的特性:①與原始分數(shù)等值;②具有意義;③等單位;④具有參照點。 (二)常模 常模分數(shù)構(gòu)成的分布,就是通常所說的常模,它是解釋心理測驗分數(shù)的基礎(chǔ)。 對于某些特殊的群體來說,情況很具體而特殊,我們就需要制定特殊常模。 常模表示一種最簡單、最基本的且常用的呈現(xiàn)常模資料的方法。它的構(gòu)成要素為:①原始分數(shù);②導出分數(shù);③對常模團體的有關(guān)具體描述。 常模類型 一、發(fā)展常模 發(fā)展常模就是年齡量表。在年齡量表中,個人的分數(shù)指出了他的行為在按正常途徑發(fā)展方面處于什么樣的發(fā)展水平。 (一)發(fā)展順序量表 發(fā)展順序量表可以告訴人們某兒童的發(fā)育與其年齡相比:①超前;②滯后;③正常。 最早的一個發(fā)展順序量表的范例是葛塞爾發(fā)展程序表。 葛塞爾發(fā)展程序表,其中按月份顯示兒童在如下幾方面的大致發(fā)展水平:①運動水平;②適應(yīng)性;③語言。④社會性。 按照葛塞爾研究的嬰兒行為變化的順序,16周的嬰兒能使頭保持平衡。 皮亞杰的研究著重于從嬰兒到十多歲兒童認知過程的發(fā)展,尤其注重某些特殊概念的形成,其中最著名的工作就是對守恒概念的研究。 皮亞杰發(fā)現(xiàn),兒童在不同時期出現(xiàn)不同的守恒概念,通常兒童到5歲時才會理解質(zhì)量守恒;6歲時才會掌握重量守恒;7歲時才具有容量守恒概念。 發(fā)展量表中的年齡量表最基本的假設(shè)是所測量的特質(zhì)隨年齡有系統(tǒng)地改變。所以,它的基本要素是:①一組可以區(qū)分不同年齡組的題目;②一個常模團體;③常模表。 最直觀的發(fā)展常摸是發(fā)展順序量表。 (二)智力年齡 比內(nèi)一西蒙量表中首先使用智力年齡的概念。 一個兒童在年齡量表上所得的分數(shù),就是最能代表他的智力水平的年齡。這種分數(shù)叫智力年齡,簡稱智齡。 在吳天敏修訂的比內(nèi)一西蒙量表中,某兒童通過了 4歲組的全部題目,5歲組通過3題,6歲組通過2題,7歲組通過1題,其智齡為5歲。用陸志韋修訂的比內(nèi)—西蒙量表做測驗,某兒童6歲組題目全部通過,7歲組通過4題,8歲組通過3題,9歲組通過2題,其智齡為7歲6 個月。 (三)年級當量 常模樣本中6年級的算術(shù)平均分為35,某兒童在算術(shù)測驗中得35分,那就是說,該兒童的算術(shù)年級當量是6年級水平。 二、百分位常模 百分位常模包括:①百分等級;②百分點;③四分位數(shù);④十分位數(shù)。 (一)百分等級 一個測驗分數(shù)的百分等級是指在常模樣本中低于這個分數(shù)的人數(shù)百分比。 55的百分等級表示在常模樣本中有55%的人比這個分數(shù)低。 王紅在 30名同學中物理成績是 80分,排列第五名,則其百分等級為85。 (二)百分點 在分數(shù)量表上,相對于某一百分等級的分數(shù)點就叫百分點或百分位數(shù)。 高考的最高分為650,其百分等級為100,最低分為105分,百分等級為1,要錄取20%的學生進入大學,百分等級為80的百分位數(shù)540。 (三)四分位數(shù)和十分位數(shù) 四分位數(shù)是將量表分成四等份,相當于百分等級的25%、50%和75%對應(yīng)的三個百分數(shù)分成的四段。 十分位數(shù)1%~10%為第一段。 三、標準分常模 標準分常模是將原始分數(shù)與平均數(shù)的距離以標準差為單位表示出來的量表。因為它的基本單位是標準差,所以叫標準分數(shù)。常見的標準分數(shù)有Z分數(shù)和:①Z分數(shù);②T分數(shù);③標準九分數(shù);④離差智商。 標準分數(shù)可以通過線性轉(zhuǎn)換和非線性轉(zhuǎn)換得到。 (一)線性轉(zhuǎn)換的標準分數(shù) Z=(X—)/SD式中 SD為樣本標準差。X為任一原始分數(shù),為樣本平均數(shù)。 Z=A+BZ式中Z為轉(zhuǎn)換后的標準分數(shù),A、B為根據(jù)需要指定的常數(shù)。加上一個常數(shù)是為了去掉負值,乘以一個常數(shù)是為了使單位變小從而去掉小數(shù)點。 (二)非線性轉(zhuǎn)換的標準分數(shù) 當原始分數(shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)換過程是非線性的。 常態(tài)化過程主要是將原始分數(shù)轉(zhuǎn)化為百分等級,再將百分等級轉(zhuǎn)化為常態(tài)分布上相應(yīng)的離均值,并可以表示為任何平均數(shù)和標準差。 當以50為平均數(shù),以10為標準差來表示時,通常叫T分數(shù)。 最早使用T分數(shù)者是麥柯爾。注:未見教材中描述。 標準九分是一種標準分數(shù)系統(tǒng),其量表是個9級的分數(shù)量表。它是以5為平均數(shù),以2為標準差的一個量表。 標準十分,平均數(shù)為5,標準差為1.5。 標準二十分,平均數(shù)為10,標準差為3。 常用標準分數(shù) 標準分數(shù) 平均數(shù) 標準差 Z分數(shù) 樣本平均數(shù) 樣本標準差SD T分數(shù) 50 10 標準九分 5 2 標準十分 5.5 1.5 標準二十分 10 3 離差智商 100 15(韋氏) 四、智商及其意義 若兒童的心理年齡高于其生理年齡,則智力較一般兒童高,若心理年齡低于其生理年齡,則智力較一般兒童低。但在實踐中發(fā)現(xiàn),單純用心理年齡來表示智力高低的方法缺乏不同年齡兒童間的可比性。 (一)比率智商 比率智商(IQ)被定義為心理年齡與實足年齡之比。比率智商的計算公式是IQ=(MA/CA)100。 不符合比率智商含義的說法是:①心理年齡除以實足年齡所得的商數(shù);②實足年齡除以心理年齡所得的商數(shù);③被試成績與平均數(shù)之差除以標準差所得的商數(shù);④被試成績除以標準差所得的商數(shù)。 由于個體智力增長是一個由快到慢再到停止的過程,即心理年齡與實足年齡不同步增長,所以比率智商并不適合于年齡較大的被試者。 (二)離差智商 韋克斯勒將離差智商的平均數(shù)定為100,標準差定為15。 離差智商的優(yōu)點是:①建立在統(tǒng)計學的基礎(chǔ)之上;②表示的是個體智力在年齡組中所處的位置;③表示的是智力高低的一種理想的指標。 離差智商表示的是個體智力在年齡組中所處的位置。 IQ=100十15Z’=100十15(X-)/SD是離差智商的計算公式。 從不同測驗獲得的離差智商只有當標準差相同或接近時才可以比較。 兩種智商及其計算公式 智 商 計算公式 比 率 智 商 IQ=(MA/CA)100 離差智商(韋氏) IQ=100十15(X-)/SD 常模分數(shù)表示 一、轉(zhuǎn)換表法 最簡單而且最基本的表示常模的方法就是轉(zhuǎn)換表,有時也叫常模表。 測驗的使用者利用轉(zhuǎn)換表可將原始分數(shù)轉(zhuǎn)換為與其對應(yīng)的導出分數(shù),從而對測驗的分數(shù)做出有意義的解釋。 二、剖面圖法 剖面圖是將測驗分數(shù)的轉(zhuǎn)換關(guān)系用圖形表示出來,從而可以很直觀地看出被試者在各個分測驗上的表現(xiàn)及其相對的位置。 測驗信度 概念 一、信度的定義 信度是指在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復(fù)測量同一被試者,所得結(jié)果的一致程度。信度只受隨機誤差的影響。 在測量理論中,信度被定義為:一組測量分數(shù)的真分數(shù)方差與總方差(實得分數(shù)的方差)的比率,即rxx=ST2/ Sx2。 二、信度的指標 (一)信度系數(shù)與信度指數(shù) 公式rxx=rxT2=ST2/Sx2和公式rxT=Sr/Sx表明信度指數(shù)的平方就是信度系數(shù)。 (二)測量標準誤 SE=Sx公式中SE為測量的標準誤,Sx是所得分數(shù)的標準差,rxx為測驗的信度系數(shù)。從公式中可以看出,測量的標準誤與信度之間的關(guān)系是:①信度越低,標準誤越大;②信度越高,標準誤越小。 評估方法 估計信度的方法一般有:①重測信度;②復(fù)本信度;③內(nèi)部一致性信度;④評分者信度。 一、重測信度 使用同一測驗,在同樣條件下對同一組被試者前后施測兩次測驗,求兩次得分間的相關(guān)系數(shù),叫重測信度,又稱穩(wěn)定性系數(shù)。 用重測法估計信度,最適宜的時距隨測驗的目的、性質(zhì)和被試者的特點而異,一般是2~4周較宜,間隔時間最好不超過6個月。 二、復(fù)本信度 復(fù)本信度又稱等值性系數(shù)。它是以兩個等值但題目不同的測驗(復(fù)本)來測量同一群體,然后求得被試者在兩個測驗上得分的相關(guān)系數(shù)。復(fù)本信度反映的是測驗在內(nèi)容上的等值性。 如果復(fù)本信度考慮到兩個復(fù)本實施的時間間隔,并且兩個復(fù)本的施測相隔一段時間,則稱:①重測復(fù)本信度;②穩(wěn)定與等值系數(shù)。 復(fù)本信度的缺點有:①如果測量的行為易受練習的影響,則復(fù)本信度只能減少而不能完全消除這種影響;②由于第二個測驗只改變了題目的內(nèi)容,已經(jīng)掌握的解題原則可以很容易地遷移到同類問題;③對于許多測驗來說,建立復(fù)本是十分困難的。 三、內(nèi)部一致性信度 (一)分半信度 分半信度通常是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半,并分別計算每位被試者在兩半測驗上的得分,求出這兩半分數(shù)的相關(guān)系數(shù)。這個相關(guān)系數(shù)就代表了兩半測驗內(nèi)容取樣的一致程度。 斯皮爾曼一布朗公式rxx=2rhh/(1+rhh)式中rhh為一半分數(shù)的相關(guān)系數(shù),rxx為測驗在原長度時的信度估計值。 (二)同質(zhì)性信度 同質(zhì)性信度主要代表測驗內(nèi)部所有題目間的一致性。 K-R20公式、K-R21公式有別于克倫巴赫 a系數(shù)的是,它們只能用于是非題。 四、評分者信度 一般要求在成對的受過訓練的評分者之間平均一致性達到0.90以上,才認為評分是客觀的 正確的描述是:①隨機抽取若干份測驗卷,由兩位評分者按評分標準分別給分,然后再根據(jù)每份測驗卷的兩個分數(shù)計算相關(guān),即得評分者信度;②所有題目看起來好像測量同一特質(zhì),但相關(guān)很低或為負相關(guān)時,則測驗為異質(zhì)的;③人的多數(shù)心理特征如智力、性格、興趣等,具有相對的穩(wěn)定性,間隔一段時間,不會有很大變化;④不同的信度反映測驗誤差的不同來源。 信度與測驗分數(shù)解釋 一、解釋真實分數(shù)與實得分數(shù)的相關(guān) rxx為信度系數(shù)。下列情況屬于極端情況:①rxx=0;②rxx=1.00。 二、確定信度可以接受的水平 確定可以接受的信度水平的一般原則是,當rxx<0.70時,測驗不能用于對個人做出評價或預(yù)測,而且不能作團體比較。0.70≤rxx<0.85時,可用于團體比較;rxx≥0.85可用于個人和團體 三、解釋個人分數(shù)的意義 信度系數(shù)在解釋個人分數(shù)的意義時的作用是:①估計真實分數(shù)的范圍;②了解實得分數(shù)再測時可能的變化情形。 “大約有 95%的可能性真分數(shù)落在所得分數(shù)1.96SE的范圍內(nèi),或有5%的可能性落在范圍之外”的描述,其置信區(qū)間為X-1.96SE < XT ≤X+1.96SE。 四、比較不同測驗分數(shù)的差異 甲被試在韋氏成人智力測驗中言語智商為102,操作智商為110。已知兩個分數(shù)都是以100為平均數(shù),15為標準差的標準分數(shù)。假設(shè)言語測驗和操作測驗的分半信度分別為0.87和 0.88,那么甲被試的操作智商不顯著高于言語智商。 影響因素 一、樣本特征 一般而言,若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度。 二、測驗長度 一般來說,在一個測驗中增加同質(zhì)的題目,可以使信度提高。下列描述中正確的是:①測驗越長,測驗的測題取樣或內(nèi)容取樣就越有代表性;②測驗越長,被試者受猜測因素的影響就越??;③測驗太長,有時反而會引起被試者的疲勞和反感而降低可靠性。 一個包括 40個題目的測驗信度為 0.80,欲將信度提高到 0.90,通過斯皮爾曼一布朗公式的導出公式計算出至少應(yīng)增加50個題數(shù)。K=[0.9(1-0.8)]/[0.8(1-0.9)]=2.25,即要取得0.9的信度,測驗長度應(yīng)為原來的2.25倍,即需增加402.25-40=50,習題74的正確選擇應(yīng)為D。 三、測驗難度 對于不同平均能力水平的團體,題目的難度會影響信度系數(shù)。 洛德(Lord)提出在學績測驗中,為了保證其可靠性,各類選擇題的理想平均難度為:五擇一測題,0.70;四擇一測題,0.74;三擇一測題,0.77;二擇一題,0.85。 四、時間間隔 以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大。 測驗效度 概念 一、效度的定義 在心理測驗中,效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準確性。 在測驗理論中,效度被定義為在一組測量中,與測量目標有關(guān)的真實方差(或稱有效方差)與總方差的比率。 二、效度的性質(zhì) 效度具有兩個性質(zhì):①相對性;②連續(xù)性。 效度具有相對性,因此,在評鑒測驗的效度時,必須考慮測驗的目的與功能。 [專欄5-4] 信度和效度的關(guān)系 信度與效度的關(guān)系可表述為:①信度是效度的必要而非充分條件;②效度是受信度制約的。 評估方法 美國心理學會在1974年發(fā)行的《教育與心理測量之標準》一書中將效度分為幾個大類:即:①內(nèi)容效度;②構(gòu)想效度;③效標效度。 一、內(nèi)容效度 (一)什么是內(nèi)容效度 內(nèi)容效度指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領(lǐng)域的代表性取樣。 (二)內(nèi)容效度的評估方法 內(nèi)容效度的評估方法有:①專家判斷法;②統(tǒng)計分析法;③經(jīng)驗推測法。 1.專家判斷法 專家判斷法,就是請有關(guān)專家對測驗題目與原定內(nèi)容的符合性做出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認為測驗題目恰當?shù)卮砹怂鶞y內(nèi)容,則測驗具有內(nèi)容效度。因此,內(nèi)容效度有時又稱邏輯效度。 為了使內(nèi)容效度的確定過程更為客觀,彌補不同專家對同一測驗的判斷可能不一致,可采用的步驟是:①定義好測驗內(nèi)容的總體范圍;②編制雙向細目表;③制定評定量表來測量測驗的整個效度。 2.統(tǒng)計分析法 除了描述性語言外,內(nèi)容效度的確定也可采用一些統(tǒng)計分析方法,如:①計算兩個評分者一致性;②復(fù)本相關(guān);③再測法。 3.經(jīng)驗推測法 (三)內(nèi)容效度的特性 在編制測驗時,效度是重要的要考慮的特性。如果是編制最高行為測驗,除了內(nèi)容效度,也要求有較高的表面效度。相反,典型行為測驗卻要求較低的表面效度。 二、構(gòu)想效度 (一)什么是構(gòu)想效度 構(gòu)想效度是:①構(gòu)思效度(結(jié)構(gòu)效度);②主要涉及的是心理學的理論概念問題;③指測驗?zāi)軌驕y量到理論上的構(gòu)想或特質(zhì)的程度;④測驗的結(jié)果是否能證實或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。 (二)構(gòu)想效度的估計方法 構(gòu)想效度的估計方法包括:①對測驗本身的分析;②測驗間的相互比較;③效標效度的研究證明;④實驗法和觀察法證實。 1.對測驗本身的分析 可以作為構(gòu)思效度證據(jù)的有:①測驗的內(nèi)容效度;②測驗的內(nèi)部一致性指標;③分析被試者對題目的反應(yīng)特點。 2.測驗間的相互比較 可以作為構(gòu)思效度的測驗間比較的有:①相容效度;②區(qū)分效度;③因素分析法。 計算兩種測驗之間得分的相關(guān),其中一種測驗是待研究效度的,另一種是已有效度證據(jù)的成熟的測驗,但兩者測量的是同一種心理特質(zhì),假如相關(guān)高,說明新測驗所測量的特質(zhì)確實是老測驗所反映的特質(zhì)或行為。這種方法叫相容效度。 3.效標效度的研究證明 4.實驗法和觀察法證實 三、效標效度 (一)什么是效標效度 又稱實證效度。效標效度反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度。它可分為:①同時效度;②預(yù)測效度。 在檢驗一個測驗的效標效度時,難點在于找到合適的效標。因此效標的選擇至關(guān)重要,一個好的效標必須具備如下條件:①效標必須能最有效地反映測驗的目標,即效標測量本身必須有效;②效標必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素而變化;③效標可以客觀地加以測量,可用數(shù)據(jù)或等級來表示;④效標測量的方法簡單,省時省力,經(jīng)濟實用。 (二)效標效度的評估方法 效標效度的主要評估方法有:①命中率法;②區(qū)分法;③相關(guān)法。 1.相關(guān)法 相關(guān)法是求測驗分數(shù)與效標資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。根據(jù)變量的不同,可選用的計算方法有:①積差相關(guān)法;②點二列相關(guān)公式;③二列相關(guān)公式;④賈斯朋(Juspen)多系列相關(guān)公式。 2.區(qū)分法 區(qū)分法是檢驗測驗分數(shù)能否有效地區(qū)分由效標所定義的團體的一種方法。 3.命中率法 命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法。命中的情況是指:①預(yù)測成功而且實際也成功;②預(yù)測失敗且實際上也失敗。 功能 一、預(yù)測誤差 效度系數(shù)的實際意義常常以決定系數(shù)來表示,如測驗的效度是 0.80,則測驗的總方差中有64%的方差是測驗分數(shù)的方差。如果某測驗的效度是0.70,則在測驗中無法作出正確預(yù)測的比例是0.51。 Sest=Sy中,rxy2代表效度系數(shù)的平方,即決定系數(shù),Sy為效標成績的標準差。 二、預(yù)測效標分散 Y = a + bxyX式中Y是預(yù)測的效標分數(shù) 三、預(yù)測效標指數(shù) 預(yù)測效率指數(shù) E值的大小表明使用測驗比盲目猜測能減少多少誤差。如一個測驗的效度系數(shù)為 0.80,E=40,這表明由于該測驗的使用,使得我們在估計被試者的效標分數(shù)時減少了40%的誤差。 影響因素 一、測驗本身的因素 要保證測驗具有較高效度,測驗本身的因素要做到:①測驗材料必須對整個內(nèi)容具有代表性;②測題設(shè)計時應(yīng)盡量避免容易引起誤差的題型(如是非題);③測題難度要適中,具有較高的區(qū)分度;④測驗長度要恰當,測題的排列應(yīng)先易后難。 二、測驗實施中的干擾因素 測驗實施中的干擾因素包括:①主試者的影響因素;②測驗情境;③其他干擾因素;④被試者的影響因素。 三、樣本團體的性質(zhì) (一)樣本團體的異質(zhì)性 如果其他條件相同,樣本團體越同質(zhì),分數(shù)分布范圍越小,測驗效度就越低。 (二)干涉變量 樣本團體的性質(zhì)包括年齡、性別、教育水平、智力、動機、興趣、職業(yè)和任何有關(guān)的特征。由于這些特征的影響,使得測驗對于不同的團體具有不同的預(yù)測能力,故測量學上稱這些特征為干涉變量。 美國心理學家吉賽利(E.E.Ghiselli)提出了如何找出干涉變量的一套方法,它們是: ① 用回歸方程求得每個人的預(yù)測效標分數(shù),將該分數(shù)與實際效標分數(shù)相比較,獲得差異分數(shù)D。如果D的絕對值很大,說明測驗中可能存在干涉變量; ② 根據(jù)樣本團體的組成分析,找出對照組,分別計算效度,從而找出干涉變量; ③ 對于欲測團體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測性高和預(yù)測性低的兩個亞團體。對于預(yù)測性高的團體,獲得的測驗效度會有所提高。 四、效標的性質(zhì) 效標與測驗分數(shù)之間的相關(guān),用皮爾遜積差相關(guān)系數(shù)的前提是假設(shè)兩個變量的關(guān)系是線性的分布。 效標測量本身的可靠性如何亦是值得考慮的一個問題。效標測量的可靠性即效標測量的信度。 測量應(yīng)用 項目分析 一般來說,測驗的項目分析包括定性分析和定量分析。 項目的定性分析包括考慮項目的內(nèi)容效度,題目編寫的恰當性和有效性等。 項目難度 一、定義 難度是指項目的難易程度。用P代表。P值越大,難度越低。 在能力測驗中通常反映難度水平的指標,在非能力測驗(如人格測驗)中,類似的指標稱通俗性。 在200個學生中,答對某項目的人數(shù)為120人,則該項目的難度為0.6。 二、計算方法 (一)二分法記分的項目 計算項目難度的公式如下:①P=R/N100%;②P=(PH+PL)/2;③P=X/Xmax100%。 在370名被試者中,選為高分組和低分組的被試者各有100人,其中高分組有70人答對第1題,低分組有40人答對第1題,則第1題的難度為0.55。 吉爾福特為了平衡機遇對難度的影響,提出的難度校正公式是Cp=(KP-1)/(K-1)。 (二)非二分記分的項目 數(shù)學測驗的第7題滿分為15分,該題考生的平均得分為9.6分,則該題的難度為0.64。 三、難度水平的確定 (一)項目的難度 難度P值越接近于0或接近于1,越無法區(qū)分被試者之間能力的差異。相反,P值越接近于0.50,區(qū)別力越高。為了使測驗具有更大的區(qū)別力,應(yīng)選擇難度在0.50左右的試題比較合適,各題難度應(yīng)在0.500.20之間。 (二)測驗的難度 項目區(qū)分度 一、定義 項目區(qū)分度也叫鑒別力,是指測驗項目對被試者的心理特性的區(qū)分能力。 二、計算方法 (一)鑒別指數(shù) 鑒別指數(shù)的計算步驟為(2-1-3-4):(1)確定高分組與低分組,每一組取答卷總數(shù)的27%;(2)按測驗總分高低排列答卷;(3)分別計算高分組與低分組在該項目上的通過率或得分率;(4)按下列公式估計出項目的鑒別指數(shù):D=PH-PL。 1965年,美國測驗專家伊貝爾(L.Ebel)根據(jù)長期的經(jīng)驗提出用鑒別指數(shù)評價項目性能的標準,鑒別指數(shù)D為0.19以下,說明該項目差,必須淘汰。 (二)相關(guān)法 計算區(qū)分度最常用的方法是相關(guān)法,常用的相關(guān)法有:①點二列相關(guān);②二列相關(guān);③ф相關(guān);④積差相關(guān)。 1.點二列相關(guān):點二列相關(guān)適用于一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對變量的相關(guān)計算。 2.二列相關(guān):二列相關(guān)適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類的相關(guān)計算。 3.Ф相關(guān)法:Ф相關(guān)適用于兩個變量均為二分稱名變量的相關(guān)計算。 三、區(qū)分度與難度的關(guān)系 難度與區(qū)分度的關(guān)系,一般來說,較難的項目對高水平的被試者區(qū)分度高,中等難度的項目對中等水平的被試者區(qū)分度高。 項目難度的分布一般以常態(tài)分布為好,這樣不僅能保證多數(shù)項目具有較高的區(qū)分度,而且可以保證整個測驗對被試者具有較高的區(qū)分能力。 測驗編制程序 測驗?zāi)繕朔治? 一、測驗的對象 在編制測驗前首先要明確測量的對象,也就是該測驗編成后要用于哪些團體。只有對受測者的如下幾方面心中有數(shù),編制測驗時才能有的放矢:①年齡;②受教育程度;③社會經(jīng)濟水平;④閱讀水平。 二、測驗的用途 測驗用途不同,編制測驗時的取材范圍以及試題難度等也不盡相同。在測驗編制前就應(yīng)明確所編出的測驗是要對被試者做:①描述;②診斷;③選拔;④預(yù)測。 (一)顯示性測驗 顯示性測驗是指測驗題目和所要測量的心理特征相似的測驗。古德納夫曾經(jīng)將其分為樣本測驗和標記測驗。 (二)預(yù)測性測驗 三、測驗的目標 心理測驗的目標是指編制的測驗是測什么的,即用來測量什么樣的心理變量或行為特征。 心理測驗的目標分析以測驗不同而異,一般可分為:①工作分析;②對特定概念下定義;③確定測驗的具體內(nèi)容。 對于選拔和預(yù)測功用的預(yù)測性測驗,它的主要任務(wù)就是要對所預(yù)測的行為活動作具體分析,我們稱之為任務(wù)分析或工作分析(job analysis)。這種分析包括如下步驟:①確定哪些心理特征和行為可以使要預(yù)測的活動達到成功;②建立衡量被試者是否成功的標準,這個標準我們稱之為效標。 測題編寫 一、搜集資料 心理測驗題目的來源應(yīng)該排除直接翻譯國外測驗的題目。題目來源分為三方面:①已出版的標準測驗;②理論和專家的經(jīng)驗;③臨床觀察和記錄。 二、命題的一般原則 心理測驗命題的一般原則可以從幾方面來考慮:①內(nèi)容;②文字;③理解;④社會敏感性。 (一)內(nèi)容方面 心理測驗命題在內(nèi)容方面的主要要求是:①內(nèi)容符合測驗的目的;②避免貪多而亂出題;③內(nèi)容取樣要有代表性;④題目間內(nèi)容相互獨立。 (二)文字方面 心理測驗命題在文字方面的主要要求是:①使用準確的當代語言;②語句簡明扼要;③排除與答案無關(guān)的因素;④最好是一句話說明一個概念。 (三)理解方面 心理測驗命題在理解方面的主要要求是:①有確切的答案;②除創(chuàng)造力測驗和人格測驗外不應(yīng)具有引起爭議的可能;③內(nèi)容不要超出受測團體的知識水平和理解能力;④格式要不被人誤解。 (四)社會敏感性方面 有些測驗必須涉及一些社會敏感性問題,菲力普(Phillips,D.L)列舉了值得參考的幾個策略:①命題時假定被試者具有某種行為;②命題時假定規(guī)范不一致;③指出該行為是常見的,雖然是違規(guī)的。 三、測題的編制要領(lǐng) (一)選擇題 選擇題要編好題干,也要編好選項,必須注意:①題干問題明確,避免與選項用詞一致;②選項簡明扼要,長度相等;③每題只給一個正確答案;④選項最好用同一形式。 (二)是非題 編制是非題應(yīng)注意:①內(nèi)容以有意義的概念、事實或基本原則為基礎(chǔ);②每道題只能包舍一個概念;③盡量避兔否定的敘述,尤其是雙重否定;④“是”、“非”題的數(shù)目應(yīng)基本相等,隨機排列。 (三)簡答題 編制簡答題的原則包括:①宜用問句形式;②填充形式的空格不宜太多;③每題應(yīng)只有一個正確答案。 編制簡答題的原則不包括將其操作化。 (四)操作題 編制操作測驗的原則有:①明確所要測量的目標,并將其操作化;②盡量選擇真實性程度較高的項目;③指導語要簡明扼要;④制訂評分標準,確定計分方法。 測驗編排和組織 一、合成測驗 (一)選擇與審定試題 1.選擇試題的形式 在選擇題目形式時,需要考慮:①測驗的目的;②材料的性質(zhì);③接受測驗的團體的特點;④各種實際因素。 2.審定題目 審定試題要注意題目的:①范圍應(yīng)與測驗計劃的雙向細目表相一致;②數(shù)量要比最后所需的數(shù)目多一倍至幾倍;③難度必須符合測驗?zāi)康牡男枰?;④說明必須清楚明白。 (二)測題的編排 測驗編排的一般原則應(yīng)排除答案混合排列。測驗編排的一般原則包括:①難度逐步上升,先易后難;②將同類型的測題組合在一起;③依各種類型測題本身的特點編排題目與選項。 測題常見的排列方式有:①并列直進式;②混合螺旋式。 二、預(yù)測與項目分析 預(yù)測應(yīng)注意:①對象應(yīng)取自將來正式測驗準備應(yīng)用的群體;②實施過程與情境應(yīng)力求與將來正式測驗時的情況相近似;③時限可稍寬一些,最好使每個被試者都能將題目做完;④預(yù)測過程中,隨時記錄被試者的反應(yīng)情形。 三、信度和效度考察 四、常模制訂 五、編寫指導手冊 測驗指導手冊的內(nèi)容有:①測驗的目的和功用;②編制的理論背景,選材的原則、方法;③實施測驗的說明,測驗的標準答案和記分標準;④測驗的心理計量學特征、常模資料。 心理測驗的使用 主試的資格 一、知識結(jié)構(gòu) 主試者的知識結(jié)構(gòu)是指開展心理測驗工作所必須具備的:①心理學基礎(chǔ)知識;②心理學專業(yè)理論知識;③本行業(yè)的專業(yè)知識;④心理測驗專業(yè)技能。 二、專業(yè)理論知識和專業(yè)技能 (一)專業(yè)理論知識 主試者的心理測驗專業(yè)理論知識,具體言之,包括:①對心理測驗的特點、性質(zhì)和作用的認識;②對心理測驗局限性的認識;③了解測驗的基本特征;④熟悉保證心理測驗標準化的必要性。 (二)專業(yè)技能 主試者必須具有實際操作心理測驗的專業(yè)技能和經(jīng)驗,接受嚴格、系統(tǒng)的心理測驗專業(yè)訓練,熟悉有關(guān)測驗的如下方面:①內(nèi)容;②適用范圍;③測驗程序;④記分方法。 三、職業(yè)道德 主試者的職業(yè)道德包括:①測驗的保密;②測驗的控制使用;③測驗中個人隱私的保護。 心理測驗的保密涉及到:①測驗內(nèi)容;②測驗結(jié)果;③個人隱私。 測驗的選擇 選擇測驗必須注意,所選測驗必須:①適合測量的目的;②符合心理測量學的要求。 一、所選測驗必須適合測量的目的 二、所選測驗必須符合心理測量學的要求 測驗前的準備及注意事頂 一、測驗的準備工作 測驗前的準備工作主要包括:①預(yù)告測驗;②準備測驗材料;③熟悉測驗指導語;④熟悉測驗的具體程序。 二、測驗中主試的職責 測驗中主試者的職責是指:①應(yīng)按照指導語的要求實施測驗;②測驗前不講太多無關(guān)的話;③主試者不應(yīng)對被試者的反應(yīng)做出任何暗示性反應(yīng);④對特殊問題要有心理準備。 三、建立協(xié)調(diào)關(guān)系 在心理測驗實施中,主試者和被試者之間建立了一種友好的、合作的、能促使被試者最大限度地做好測驗的關(guān)系,叫協(xié)調(diào)關(guān)系。 測驗實施的程序及要素 一、指導語 測驗指導語一般組成為:①如何選擇反應(yīng)形式;②如何記錄這些反應(yīng);③時間限制;④給例題,有時告知被試者測驗?zāi)康摹? 二、時限 一般來說,心理測驗除典型行為測驗以外,都有時限。 三、測驗的環(huán)境條件 對于測驗的環(huán)境條件:①必須完全遵從測驗手冊的要求;②記錄下任何意外的測驗環(huán)境因素;③在解釋測驗結(jié)果時也必須考慮這一因素。 安排測驗材料不是對測驗環(huán)境條件的要求。 被試誤差及控制方法 一、應(yīng)試技巧與練習效應(yīng) (一)應(yīng)試技巧 被試者對測驗的經(jīng)驗或應(yīng)試技巧會影響測驗成績,“測驗油子”的表現(xiàn)有:①能覺察出正確答案與錯誤答案的細小差別;②懂得合理分配測驗時間;③常常是各種題型都見過;④熟悉測驗的程序。 (二)練習效應(yīng) 受練習效應(yīng)影響較大的情況,具體表現(xiàn)為:①智力較高者;②重復(fù)實施相同的測驗;③著重速度的測驗。 二、動機與焦慮因素 (一)應(yīng)試動機 受應(yīng)試動機影響不太大的測驗是投射測驗。 (二)測驗焦慮 適度的焦慮會提高智力測驗、成就測驗和能力傾向測驗的成績。 研究表明,如下者,測驗焦慮較高:①對自己能力沒有把握;②抱負水平過高,求勝心切;③缺乏自信、患得患失、情緒不穩(wěn)定;④測驗成績關(guān)系重大,壓力過大。 三、反應(yīng)定勢 反應(yīng)定勢是指獨立于測驗內(nèi)容的反應(yīng)傾向,即由于每個人回答問題的習慣不同,而使能力相同的被試者得到不同的測驗分數(shù)。 作測驗時,幾種常見的反應(yīng)定勢有:①求“快”與求“精確”;② 喜好正面敘述;③喜好較長選項;④喜好特殊位置;猜測。 (一)求“快”與求“精確”的反應(yīng)定勢 除非“反應(yīng)速度”本身即為重要的研究目標,否則讓被試者有充分的時間反應(yīng),同時注明每題的答題時間,可以減少如下定勢的影響:①求“快”;② 求“精確”。 (二)喜好正面敘述的反應(yīng)定勢 在編制是非題時,“是”、“否”題大致相等或答“否”題略多,是控制肯定定勢的有效方法。 (三)喜好特殊位置的反應(yīng)定勢 在測驗編制過程中,正確答案的位置在整個測驗中出現(xiàn)在各位置的概率相等,就可以控制喜好特殊位置定勢的影響。 (四)喜好較長選項的反應(yīng)定勢 測驗中,有些被試者認為選項長、內(nèi)容多,一般是正確答案,在無法確定何者正確時,有偏好長選項的反應(yīng)定勢。在編制測驗時,只要我們盡量使選項的長度一致,就不難避免這類問題。 (五)猜測的反應(yīng)定勢 測驗的評分 一、原始分數(shù)的獲得 無論哪種測驗,為使評分盡可能客觀應(yīng)準確無誤地計分、合分。 二、原始分數(shù)的轉(zhuǎn)換 測驗結(jié)果的報告 一、測驗分數(shù)的綜合分析 測驗分數(shù)一般應(yīng)是一個范圍而不是一個確定的點。如在韋氏智力測驗中,通常是用測得的IQ值加減5(85%~90%的可信限水平)的方法判斷IQ值的波動范圍。 不能把分數(shù)絕對化,更不能僅僅根據(jù)一次測驗的結(jié)果輕易下結(jié)論。一個人在任何一個測驗上的分數(shù),都是他的遺傳特征、測驗前的學習與經(jīng)驗以及測驗情境的函數(shù)。 不能把分數(shù)絕對化,更不能僅僅根據(jù)一次測驗的結(jié)果輕易下結(jié)論,要做到:①考慮個人在測驗前的經(jīng)歷;②考慮測驗情境;③有常模和信度、效度資料;④不直接比較來自不同測驗的分數(shù)。 對測驗分數(shù)做出確切的解釋,只有常模資料是不夠的,還必須有測驗的信度和效度資料,在解釋測驗分數(shù)時,一定要依據(jù)從如下獲得的資料:①最匹配的情境;②最相近的團體。 為了使不同測驗分數(shù)可以相互比較,在經(jīng)典測驗理論的指導下,測驗等值的計算方法主要有兩大類:一類叫等百分位等值法;另一類叫線性等值法。線性等值法計算就是用相同的標準分數(shù)作等值的基礎(chǔ)。 二、報告分數(shù)的具體建議 為了使被試者本人以及與被試者有關(guān)的人,如家人、老師、雇主等,能更好地理解分數(shù)的意義,在報告分數(shù)時要注意:①應(yīng)告訴分數(shù)的解釋和建議,避免使用專業(yè)術(shù)語;②保證當事人知道該測驗測量或預(yù)測什么,與什么團體比較,如何運用他的分數(shù);③考慮給當事人帶來的心理影響;④讓當事人積極參與測驗分數(shù)的解釋。 心理測量學-13- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理咨詢 基礎(chǔ)知識 總結(jié) 心理測量學
鏈接地址:http://m.appdesigncorp.com/p-9611636.html