心理測量學(xué)教案(舊).doc
《心理測量學(xué)教案(舊).doc》由會員分享,可在線閱讀,更多相關(guān)《心理測量學(xué)教案(舊).doc(83頁珍藏版)》請在裝配圖網(wǎng)上搜索。
心理測量學(xué)(舊) 課程說明 (一)課程性質(zhì) 本課程適合于大學(xué)本科心理學(xué)、教育科學(xué)等專業(yè)的本科生及研 究生教育。本課程的學(xué)習(xí)將有助于實驗設(shè)計、教育評價、心理與 教育統(tǒng)計學(xué)等學(xué)科的學(xué)習(xí),是培養(yǎng)學(xué)生科學(xué)研究及掌握研究方法 的基礎(chǔ)性學(xué)科。 (二)教學(xué)目的 通過學(xué)習(xí),要求學(xué)生掌握心理測量的基本知識、心理測量的編制 和實施、以及良好測量所要求具備的基本條件。更重要的是,通 過本課程的學(xué)習(xí)要使學(xué)生熟練掌握不同心理測量的實際應(yīng)用。 (三)教學(xué)內(nèi)容 本課程的主要教學(xué)內(nèi)容有:心理測量的基本內(nèi)涵及其評價和測量 的一般步驟和方法兩部分。內(nèi)容涉及一般測量解析,測量的要素 及量表類型,測驗信、效度、難度和區(qū)分度,測量的一般步驟和 方法,智力測驗、人格測驗等心理測驗,以及心理測量的綜合應(yīng) 用和心理測量理論的新發(fā)展等內(nèi)容。 (四)教學(xué)時數(shù) 54個課時 (五)教學(xué)方式 課堂教學(xué)與實踐應(yīng)用相結(jié)合。 第一編 心理測量的基本內(nèi)涵及其評價 第一章 緒論 教學(xué)要點: 通過本章的學(xué)習(xí),了解測量的基本性質(zhì)及其要素,測量量表的四種 水平,心里測量的本質(zhì)、基本條件及功能,心里測量的發(fā)展以及心 理測量的道德準則等內(nèi)容,對心理測量有一個概括化的了解。 教學(xué)時數(shù):[10學(xué)時] 教學(xué)內(nèi)容: 一、一般測量解析 1.測量(Measurement)概論 2.測量的分類 3.心理測量的種類 (1)以測量對象來分,(2)以測量的目的來分,(3)以測量的方式 來分類,(4)以項目結(jié)構(gòu)或組成形式來分,(5)按評價參照的 標準分類 4.測量與測驗(Test)、考試(Examination)、評價(Evaluation)聯(lián)系 與區(qū)別 二、測量的要素及量表類型 1.測量的要素 識記: 單位(Unit),參照點(Reference Point),量表(Scale) 2.量表類型 (1)稱名量表 稱名變量只說明某一事物與其他事物在名稱、類別或?qū)傩陨系牟? 同,并不說明事物與事物之間差異的大小、順序的先后及質(zhì)的優(yōu) 劣。 (2)順序變量 順序變量是指可以就事物的某一屬性的多少或大小按次序?qū)⒏? 事物加以排列的變量,具有等級性和次序性的特點。 (3)等距變量 等距變量除能表明量的相對大小外,還具有相等的單位。 (4)比率變量 比率變量除了具有量的大小、相等單位外,還有絕對零點。 三、心理測量的本質(zhì)、基本條件及功能 1.心理測量的本質(zhì) 2.編制心理測驗的基本條件 3.心理測量的功能 (1)理論研究功能,(2)實際應(yīng)用功能 四、心理測量發(fā)展簡史 1.主觀經(jīng)驗性考試階段(1864年以前) 2.客觀標準化測驗階段(1864年——1940年) 3.觀測驗的深入發(fā)展階段(1940年——) 4.西方心理測量的發(fā)展 5.心理測驗在我國的發(fā)展 五、心理測量的道德準則 1.心理測量工作者的素質(zhì)要求 (1)心理測量工作的知識結(jié)構(gòu).(2)對心理測量的態(tài)度 2.心理測量工作者的道德準則 (1)測驗的保密和控制原則(2)測驗中個人隱私的保護 考核要求: 1.心理測量的種類 2.測量與測驗(Test)、考試(Examination)、評價(Evaluation)聯(lián)系 與區(qū)別 3.測量的要素及量表類型 單位,參照點,量表,稱名量表,順序變量,等距變量,比率變量 4.心理測量的本質(zhì)、基本條件及功能 5.心理測量發(fā)展簡史 第二章 經(jīng)典測驗理論的基本假設(shè) 教學(xué)要點: 通過本章的學(xué)習(xí),掌握經(jīng)典測驗理論的基本假設(shè),心里特之及其 特性,心里測量的誤差和種類,以及真分數(shù)的含義等內(nèi)容。 教學(xué)時數(shù):[6學(xué)時] 教學(xué)內(nèi)容: 一、心理特質(zhì)(Trait)及其可測性假設(shè) 1.經(jīng)典測驗(Classical Test Theory ,CTT)理論 2.特質(zhì)假設(shè) 二、測量誤差及其來源 1. 測量誤差的含義 2.誤差種類 識記: 隨機誤差,系統(tǒng)誤差 3.誤差來源 (1)來自心理測量工具,(2)來自測量對象,(3)來自實測過程 二、真分數(shù)模型及其假設(shè) 1. 真分數(shù)的含義 2.真分數(shù)數(shù)學(xué)模型解析 領(lǐng)會:(1)幾個推理,(2)CTT的基本含義,(3)CTT的基本公式 3.經(jīng)典測驗理論的不足 考核要求: 1.心理特質(zhì)(Trait)及其可測性假設(shè) 2.測量誤差及其來源 3.真分數(shù)模型及其假設(shè) 4.經(jīng)典測驗理論的不足 第三章測驗信度 教學(xué)要點: 通過本章的學(xué)習(xí),掌握信度的意義,信度系數(shù)的計算,了解影響 信度的主要因素以及提高信度的常用方法等內(nèi)容。 教學(xué)時數(shù):[4學(xué)時] 教學(xué)內(nèi)容: 一、信度的意義 1.信度指實測值和真值相差的程度 2.信度指統(tǒng)計量與參數(shù)之間的接近程度 3.信度是指一種測驗對相同的應(yīng)試者再次測驗時引起同樣反應(yīng)的程 度 二、信度系數(shù)的計算 1.穩(wěn)定性系數(shù) 2.等值性系數(shù) 3.等值穩(wěn)定性系數(shù) 4.內(nèi)部一致性系數(shù) 5.評分者的信度系數(shù) 三、提高測驗信度的方法 1.信度系數(shù)以多大為宜 2.影響信度的因素 3.提高測驗信度的方法 考核要求: 1.信度的意義 2.信度系數(shù)的計算 識記:穩(wěn)定性系數(shù),等值性系數(shù),等值穩(wěn)定性系數(shù),內(nèi)部一致性系 數(shù),評分者的信度系數(shù) 3.提高測驗信度的方法 請列舉一些你所使用過或接觸過的量表 思考: 量表的作用是什么? 你如何解釋下述現(xiàn)象? 一個很聰明的孩子,測得智商是80分 一個學(xué)習(xí)很好的學(xué)生,考試成績?yōu)?0分 一個人緣很好的人,人際關(guān)系測量低于常模值 量表幫助我們了解心理現(xiàn)象(心理特質(zhì)),就像尺子幫助我們測量身高。 思考:我們?nèi)绾沃牢覀冇卸喔撸? 有兩個工具:尺子 / 秤 尺子的數(shù)據(jù)與我們的目測更一致,而秤盤的數(shù)據(jù)則與我們的目測不一致。因此,尺子是測量身高的有效工具——效度。 什么材料的尺子?——鋼鐵(熱脹冷縮) 涉及到一致性的問題。——信度 ? 物理不等于數(shù)學(xué) ? 1.70與1.7的關(guān)系 ? 總結(jié):量表是我們用來了解心理特質(zhì)的工具,但這個工具是有誤 差的。誤差要控制在一個許可的范圍內(nèi)。 ? 什么是誤差? ? 誤差的種類? ? 誤差是在測量中與目的無關(guān)的變因所產(chǎn)生的不準確或不一致的效 應(yīng)。 ? 誤差分為隨機誤差和系統(tǒng)誤差。 ? 高爾頓的智力觀 ? 比奈的智力觀 ? 判斷題、選擇題和問答題 ? SX2 = ST2 + SE2 ST2 = SV2 + SI2 SX2 = SV2 + SI2 + SE2 ? 穩(wěn)定性 \ 可靠性 \ 一致性 ? 信度乃是一個被測團體真分數(shù)的變異數(shù)與實得分數(shù)的變異數(shù)之 比。 ? rXX=ST2/SX2 ? 信度乃是一個被測團體真分數(shù)與實得分數(shù)的相關(guān)系數(shù)的平方。 ? rXX=P2TX ? 思考:相關(guān)系數(shù)的平方? ? 信度乃是一個測驗X與它的任意一個平行測驗X'的相關(guān)系數(shù)。 ? rXX=PXX' ? 重測信度(Test-Retest Reliability) ? 定義:同一量表,同一被試群體,在不同時間,兩次施測,求其 相關(guān)。 ? 實質(zhì):表示測驗結(jié)果的穩(wěn)定性。故稱之為穩(wěn)定性系數(shù)(CoefficientofStability) ? 形式:施測—適當(dāng)時間—再施測 ? 間隔時間越長,穩(wěn)定性系數(shù)越低。適宜時間間隔依照測驗?zāi)康摹? 性質(zhì)及被試特點而定。 幾分鐘至幾年。 ? 年幼兒童,間隔要??;年長群體,間隔可大。智力測驗的間隔不 能太短,成就測驗的間隔不能太長。 ? 一般間隔時間不超過六個月。(即不能讓被試記住上一次測驗的內(nèi) 容,又不能讓其特質(zhì)發(fā)生變化,或?qū)λ鶎W(xué)知識產(chǎn)生遺忘) ? 在一般情況下,間隔施測的副本信度最低,因為很多因素有機會 影響到分數(shù)。相反,校正過的分半相關(guān),因為影響的因素少,所得 的信度估計為最高。 ? 實際上,有多少種誤差來源,便有 ? 多少種估計信度的方法。一個測驗?zāi)姆N誤差大,便應(yīng)該用哪種誤 差估計。有時一個測驗需要有幾種信度系數(shù),這樣我們就把總分數(shù) 的變異數(shù)分成不同的分支。 ? 假設(shè)對100個六年級學(xué)生以兩個月的時間間隔先后施測一個創(chuàng)造 力測驗的A\B兩個復(fù)本,所得的等值性與穩(wěn)定性系數(shù)為0.70。我 們還根據(jù)被試對每個復(fù)本的反應(yīng)計算出分半信度為0.80(先計算 每個復(fù)本的分半相關(guān)系數(shù)。將二者平均后再用斯皮爾曼-布朗公式 校正)。同時,我們讓另一個評分者隨機抽取50份卷子另外評分, 得到評分者信度為0.92。然后,我們對這三種方法所產(chǎn)生的誤差 變異進行分析。 一個假想測驗的誤差變異來源分析 信度類型 誤差變異量 誤差變異來源 復(fù)本信度(間隔施測) 1-0.70=0.30 時間與內(nèi)容取樣 分半信度 1-0.80=0.20 內(nèi)容取樣 上述二者差異 0.30-0.20=0.10 時間取樣 評分者信度 1-0.92=0.08 評分者差異 誤差變異總和 0.20+0.10+0.08=0.38 真實變異 1-0.38=0.62 一個假想測驗的誤差變異來源分析 真實變異 誤差變異 時間上的穩(wěn)定性, 復(fù)本之間的一致性, 評分者之間的一致性 時間取樣誤差 內(nèi)容取樣誤差 評分者間差異 62% 20% 10% 8% 第四章 測驗的效度 教學(xué)要點: 通過本章的學(xué)習(xí),掌握效度的含義,效度估計方法,了解影響信度 與效度的關(guān)系,影響效度的因素以及提高信度的幾種方法等內(nèi)容。 教學(xué)時數(shù):[10學(xué)時] 教學(xué)內(nèi)容: 一、效度概述 1.效度的一般定義及其內(nèi)涵 效度是指測驗的準確性,即測驗?zāi)軌驕y出他們所欲測的特質(zhì)的程度。 2.效度的統(tǒng)計與原理 3.效度的信度關(guān)系 (1)高效度,高信度(2)高信度,低效度(3)低信度,低效度 二、效度的估計 1966年美國心理學(xué)會在《教育心理測驗值標準》中將效度分為三大類: 1.內(nèi)容效度(Content Validity) 內(nèi)容效度指測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。 2.結(jié)構(gòu)效度(Construct Validity) 結(jié)構(gòu)效度是指測驗對于被稱作構(gòu)想的某一理論概念或特質(zhì)測量的程度。 3.實證效度(Criterion related Validity) 實證效度是指一個測驗對處于特定情景中的個體的行為進行估計的有效性。 三、提高測量效度的方法 1.各種測量效度的要求 2.提高效度的方法 (1)控制系統(tǒng)誤差,(2)精心編制量表,(3)妥善組織測驗, (4)擴充樣本容量,(5)適當(dāng)增加測驗的長度 3.效度的一般定義及其內(nèi)涵 效度是指測驗的準確性,即測驗?zāi)軌驕y出他們所欲測的特質(zhì)的程度。 4.效度的統(tǒng)計與原理 5.效度與信度的關(guān)系 (1)高效度,高信度(2)高信度,低效度(3)低信度,低效度 四、效度的估計 1966年美國心理學(xué)會在《教育心理測驗值標準》中將效度分為三大類: 1.內(nèi)容效度(Content Validity) 內(nèi)容效度指測驗實際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。 2.結(jié)構(gòu)效度(Construct Validity) 結(jié)構(gòu)效度是指測驗對于被稱作構(gòu)想的某一理論概念或特質(zhì)測量的程度。 3.實證效度(Criterion related Validity) 實證效度是指一個測驗對處于特定情景中的個體的行為進行估計的有效性。 五、提高測量效度的方法 1.各種測量效度的要求 2.提高效度的方法 (1)控制系統(tǒng)誤差,(2)精心編制量表,(3)妥善組織測驗,(4)擴充樣本容量,(5)適當(dāng)增加測驗的長度 考核要求: 1.效度的一般定義及其內(nèi)涵 2.效度的統(tǒng)計與原理 3.效度與度的信度關(guān)系 4.效度的估計 內(nèi)容效度,結(jié)構(gòu)效度,實證效度 5.提高測量效度的方法 第五章測驗的難度和區(qū)分度 教學(xué)要點: 通過本章的學(xué)習(xí),掌握測驗難度和區(qū)分度的含義,以及難度、區(qū)分度的計算,了解難度、區(qū)分度對測驗質(zhì)量的影響等內(nèi)容。 教學(xué)時數(shù):[10學(xué)時] 教學(xué)內(nèi)容: 一、測驗難度的計算 1.計算難度的基本公式 (1)以試題通過率計算難度:P=R/N,(2)用平均數(shù)計算試題的難度 2.用極端分組法計算難度 二、難度的轉(zhuǎn)換 難度轉(zhuǎn)換的方法 三、測驗題目難度水平的確定 四、區(qū)分度的定義 1.定義:區(qū)分度是指測驗對于考生實際水平的區(qū)分度程度或鑒別能力。 2.區(qū)分度與測驗信度、難度的關(guān)系 五、區(qū)分度計算 1.極端分組法計算 (1)客觀題計算,(2)論文題計算 2.用內(nèi)部一致性系數(shù)(Internal Consistency)計算區(qū)分度 (1)用點二列相關(guān)計算區(qū)分度 (2)用二列相關(guān)計算區(qū)分度 (3)用Φ相關(guān)計算區(qū)分度 (4)用四分相關(guān)計算區(qū)分度 (5)用皮爾遜相關(guān)法計算區(qū)分度 (6)D(鑒別指數(shù))的經(jīng)驗標準 考核要求: 1.測驗難度的計算 2.計算難度的基本公式 3.難度的轉(zhuǎn)換 4.測驗題目難度水平的確定 5.區(qū)分度的含義 6.區(qū)分度與測驗信度、難度的關(guān)系 7.區(qū)分度計算 用極端分組法計算,用內(nèi)部一致性系數(shù)(Internal Consistency)計算區(qū)分度 第二編測量的一般步驟和方法 第六章 測驗的編制與實施 教學(xué)要點: 通過本章的學(xué)習(xí),掌握編制測驗的基本程序,測驗的實施過程及須注意的事項等內(nèi)容。 教學(xué)時數(shù):[10學(xué)時] 教學(xué)內(nèi)容: 第一節(jié)編制心理與教育測驗的基本程序 一、確定測驗的目的 1.明確測量對象 2.明確測量目標 3.明確測量用途 二、制定編題計劃 三、編輯測驗項目 1.收集測驗資料 2.選擇項目形式 3.編寫測驗項目 四、測驗與項目分析 1.預(yù)測 2.項目分析 五、合成測驗 1.測驗項目的選擇 2.測驗項目的編排 3.編制副本 六、測驗標準化 1.測驗內(nèi)容 2.實測過程 3.測驗評分 4.測驗分數(shù)解釋 七、鑒定測驗 1.信度 2.效度 3.測驗量表與常模 八、編寫測驗說明書 第二節(jié) 測驗的實施 一、測驗的實施過程 1.實測前的準備工作 2.指導(dǎo)語 3.測驗情境 4.測驗焦慮 5.與受測者建立良好的協(xié)調(diào)關(guān)系 6.評分技術(shù) 二、測驗分數(shù)的解釋 1.如何看待測驗分數(shù)的意義 2.如何向受測者報告測驗分數(shù) 考核要求: 1. 編制測驗的基本程序 確定測驗的目的,制定編題計劃,編輯測驗項目,測驗與項目分析,合成測驗,測驗標準化,鑒定測驗,編寫測驗說明書 2.測驗的實施過程及須注意的事項等內(nèi)容 3.測驗分數(shù)的解釋 第七章 測驗分數(shù)的解釋與應(yīng)用 教學(xué)要點: 通過本章的學(xué)習(xí),掌握測驗分數(shù)的類型,常模及常模類型,以及測驗分數(shù)的解釋和常模的應(yīng)用等內(nèi)容。 教學(xué)時數(shù):[4學(xué)時] 教學(xué)內(nèi)容: 一、分數(shù)與常模 1.分數(shù)的種類和含義 識記:(1)原始分數(shù),(2)導(dǎo)出分數(shù) 2.常模 3.年齡常模 4.年級常模 5.百分等級常模 6.標準分數(shù)常模 二、測驗的等值 1.測驗等值的實質(zhì) 2.測驗等值的條件 (1)同質(zhì)性,(2)等信度,(3)公平性,(4)可遞推性, (5)對稱性,(6)樣本不變性 3.測驗等值的基本算法 識記:(1)百分位等值(2)線性等值 4.常用等值設(shè)計 5.測驗等值誤差估計 考核要求: 1.分數(shù) 原始分數(shù),導(dǎo)出分數(shù) 2.常模 年齡常模,年級常模,百分等級常模,標準分數(shù)常模 3.測驗的等值的實質(zhì)與條件 4.測驗等值的基本算法:百分位等值,線性等值 第八章 測驗的項目分析 項目分析包括定性分析和定量分析。定性分析包括考慮內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等;定量分析主要是指題目難度和區(qū)分度的測量。 對項目進行篩選和修訂,可以提高測驗的信度和效度。 第一節(jié) 測驗的難度 一、難度(difficulty)的意義 難度,指項目的難易程度。 在最高作為測驗中,稱為“難度”,而在典型作為測驗中,則指“通俗性”。兩者都是指在總體中,能夠正確或確切回答某項目的人數(shù)。 二、難度的計算 (一)二分法記分項目的難度 1.通過率 P=R/N 2.極端分組法(上下27%) P=(PH+PL)/2 (二)非二分法記分項目的難度 P=X / Xmax X為所有被試在該項目上的平均得分, Xmax為該項目的滿分。 三、測驗難度水平的確定 效標參照測驗、掌握測驗:不考慮難度; 選拔測驗:難度=錄取率; 對于選擇題來說,難度一般應(yīng)大于猜測概率; 無論是速度測驗,還是難度測驗,一般都應(yīng)防止被試得滿分,因 為滿分的意義是不明確的。 大體而言,難度為0.50時最理想,此時項目具有最大的鑒別力。但在實際操作中,讓所有項目難度都到達0.50困難很大,而且也不必要,一般只需使項目的平均難度接近0.50,而各個項目的難度在0.50 0.20之間變化。 四、難度的等距變換 根據(jù)正態(tài)分布表,將難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成相應(yīng)的Z分數(shù),這就是等距量表。 P Y 0 Z 美國教育服務(wù)中心以Δ 作為難度指標: Δ=13+4Z P = .0013 Z = +3 Δ= 25 P = .16 Z = +1 Δ= 17 P = .50 Z = 0 Δ= 13 P = .84 Z = -1 Δ= 9 P = .9987 Z = -3 Δ= 1 五、難度對測驗的影響 (一)測驗難度影響測驗分數(shù)的分布形態(tài) 難度大,正偏態(tài) 難度低,負偏態(tài) (二)測驗難度影響測驗分數(shù)的離散程度 測驗過難或過易,分數(shù)全距縮小,信度降低。 P=0.50時最佳 第二節(jié) 測驗的區(qū)分度 一、區(qū)分度的意義 區(qū)分度(discrimination)是指測驗項目對被試心理品質(zhì)水平差異的區(qū)分能力或鑒別能力。 項目的區(qū)分度是測驗是否有效的“指示器”。 二、區(qū)分度的計算 (一)項目鑒別指數(shù)法 1.鑒別指數(shù)(index of discrimination,D)的計算 D = PH - PL 取值范圍:-1~ +1 2.極端組的劃分 27%規(guī)則 一般情況下,取上下25%~33%均可。 樣本少時,可以取50% 注意: 由于計算機的方便使用,可以上下50%作為劃分高低組的標準,或者多分幾組,對區(qū)分度和難度作詳細分析。因為只取上下兩端,只利用了一部分資料,浪費了很多信息,有可能得出錯誤結(jié)論。 (二)相關(guān)法(項目-總分相關(guān)) 1.點二列相關(guān) Xp-Xq rpb= √pq St 2.二列相關(guān) Xp - Xq pq Xp - Xt p rb= 或 rb= ? St y St y 3.φ 相關(guān) ad-bc rφ= √(a+b)(c+d)(a+c)(b+d) 4.四分相關(guān) 5. 項目和總分相關(guān)重疊的校正 當(dāng)測驗項目超過20個項目時,校正法通常毫無意義。 rtpSt – Sp rpq =√St2+ Sp2 –2rtpStSp (三)項目特征曲線(item characteristic curve, ICC) 項目特征曲線描述了效標分數(shù)不同的被試在該項目上的通過率。 曲線坡度越陡,鑒別力越好,預(yù)測的誤差越小。 三、區(qū)分度與難度的關(guān)系 難度和區(qū)分度都是針對一定團體而言的。 一般來說,較難的項目對高水平被試區(qū)分度高,較易的項目對低水平被試的區(qū)分度高。 四、區(qū)分度的相對性 (一)不同的計算方法,所得區(qū)分值不同 區(qū)分度有幾種計算方法? (二)樣本容量大小影響相關(guān)法區(qū)分度值的大小 樣本越大,區(qū)分度越…… (三)分組標準影響鑒別指數(shù) 分組越極端,區(qū)分度越…… (四)被試樣本的同質(zhì)性程度影響區(qū)分度值的大小 樣本越同質(zhì),區(qū)分度越…… 第三節(jié)項目分析的特殊問題 一、多重選擇題的項目分析(誘答分析) 對于多重選擇題,除了分析難度和區(qū)分度外,還要對每個選項進行分析。 下列哪一個最有可能是偏執(zhí)型精神分裂癥患者的次級癥狀: A 幻聽 B 癱瘓 C 記憶喪失 D 厭食 如果所有被試都選擇某一正確的選項,說明該選項…… 如果沒有一個被試選擇某個錯誤選項,說明該選項…… 如果所有被試都選擇某個錯誤選項,說明該選項…… 如果高分組被試的選擇集中在兩個選項上,說明該選項…… 如果高分組和低分組對正確選項的選擇沒有區(qū)別,說明該選項…… 如果所有被試都未回答某個題目,說明該題…… 如果選擇各個選項的人數(shù)幾乎相等,說明該題…… 二、速度測驗的項目分析 對前面部分的測驗項目,難度和區(qū)分度都…… 對后面部分的測驗項目,難度和區(qū)分度都…… 三、標準參照測驗的項目分析 在標準參照測驗中,無須考慮項目的難度和區(qū)分度,只要項目的內(nèi) 容很重要就行。 也可以通過比較教學(xué)或訓(xùn)練的前測和后測結(jié)果來進行項目分析,用 來說明教學(xué)或訓(xùn)練的效果以及項目編制是否適當(dāng)。 四、項目-團體的相互作用 具有不同性質(zhì)(性別、種族、職業(yè)等)的團體,在測驗得分上也 存在差異,即同樣的項目可能有不同的難度。 如果測驗要求對所有個體都相對“公平”,那么,就應(yīng)該排除那些有 利于或不利于不同性質(zhì)的亞團體的項目; 如果測驗的目的就是為了考察不同亞團體的差異,那么,就應(yīng)選 擇使團體差異盡可能大的題目。 五、有效性與可靠性的矛盾 ? 同質(zhì)性信度要求項目之間有高相關(guān),各項目的難度均等; ? 對于預(yù)測效度來說,因為效標的變異范圍較大,如果項目越同質(zhì),那么效標關(guān)聯(lián)效度則低;因此,效標關(guān)聯(lián)效度要求各項目之間要有一定的差異,即項目之間相關(guān)低,這樣才能保證測驗得分與效標之間有高相關(guān),即高的效標關(guān)聯(lián)效度。 因此,對于多數(shù)心理測驗來說,項目之間中等程度的相關(guān),可使二者調(diào)和,獲得較為滿意的(同質(zhì)性)信度和(效標關(guān)聯(lián))效度。 第九章 學(xué)績測驗 第一節(jié) 學(xué)績測驗概述 一、學(xué)績測驗的性質(zhì) 最高作為測驗可以分為:學(xué)績測驗、能力測驗、能力傾向測驗。 學(xué)績,指經(jīng)過一定的教學(xué)或訓(xùn)練后所學(xué)到的東西,是在一個比較明確 的、相對限定的范圍內(nèi)的學(xué)習(xí)結(jié)果。 能力傾向指學(xué)習(xí)的能力,是在給予適當(dāng)?shù)臋C會時獲得某種知識或技能 的能力。 能力介于學(xué)績和能力傾向之間,指的是當(dāng)前的知識或技能的水平,既 有正式學(xué)習(xí)的,也有非正式學(xué)習(xí)的結(jié)果,既包括學(xué)術(shù)技能,又包 括非學(xué)術(shù)技能。 學(xué)績測驗用來描述現(xiàn)狀,指明一個人已經(jīng)學(xué)會了什么和能做什么。 二、學(xué)績測驗的基本假設(shè) 1 學(xué)績測驗所測量的知識和技術(shù)的范圍能明確界定。 2 測驗所測量的是研究者認為重要的東西,而不是與測量目的無關(guān)的東西。 3 被試有同樣的機會學(xué)習(xí)測驗所包含的材料。 三、學(xué)績測驗的分類 (一)按測驗的編制方法分 教師自編課堂測驗,標準化學(xué)績測驗 (二)按測驗內(nèi)容分 單科測驗,多科測驗 單元測驗,總測驗 (三)按測驗的用途分 考察性測驗,診斷性測驗,準備性測驗,選拔與安置測驗,職業(yè)水平測驗,用于研究的測驗 (四)按測驗評分的參照系分 常模參照性測驗,目標參照性測驗 (五)按測驗的題型分 客觀測驗,論文式測驗 四、學(xué)績測驗的應(yīng)用 1 反饋功能 2 診斷功能 3 輔助教學(xué)管理 4 研究工具 5 人才選拔與安置 第二節(jié) 標準化學(xué)績測驗 一、標準化學(xué)績測驗的基本要求 1 命題組卷標準化 測驗?zāi)繕耍囶}的措辭、難度、區(qū)分度,題型比例、題量 2 施測標準化 環(huán)境、時間、指導(dǎo)語、主試 3 評分標準化 標準答案、評分細則、評分者人數(shù) 4 測驗分數(shù)解釋標準化 是常模參照還是目標參照 二、標準化學(xué)績測驗的編制 由學(xué)科專家與測驗編制專家共同完成,其步驟與一般心理測驗的編制程序相同。 (一)確定測驗?zāi)康模x定測驗編制的方法 考察還是診斷,常模參照還是目標參照 (二)分析測量目標,擬訂測驗編制計劃 雙向細目表,題型,題量 (三)編題征題與選題組卷 編題征題→試測→組卷 (四)調(diào)查測驗質(zhì)量參數(shù),編制測驗常模 難度、區(qū)分度、信度、效度、常模 (五)編寫測驗指導(dǎo)書,正式出版發(fā)行 三、國外常用標準化學(xué)績測驗簡介 (一)斯坦福成就測驗 ? 綜合性學(xué)績測驗 ? 適用范圍:1~9年級 ? 內(nèi)容:詞匯、閱讀理解、拼字、聽理解、詞匯學(xué)習(xí)技能、語言、數(shù)學(xué)概念、數(shù)學(xué)計算、數(shù)學(xué)應(yīng)用、社會科學(xué)常識、自然科學(xué)常識 斯坦福早期學(xué)校成就測驗(適用于幼兒園和小學(xué)一年級) 斯坦福學(xué)業(yè)技能測驗(適用于8~12年級) 導(dǎo)出分數(shù):百分等級、標準九、年級當(dāng)量、量表分數(shù)、正態(tài)曲線當(dāng)量 分測驗信度均在0.80以上。 (二)關(guān)鍵數(shù)學(xué)算術(shù)診斷測驗 適用范圍:學(xué)前兒童~小學(xué)六年級 q 測驗內(nèi)容: ? 內(nèi)容塊:數(shù)學(xué)、分數(shù)、幾何、符號 ? 運算塊:加法、減法、乘法、除法、心算、數(shù)字推理 ? 應(yīng)用塊:文字題、補充、金錢、測量、時間 q 診斷: ? 總體水平診斷 ? 分塊水平診斷 ? 分測驗水平診斷 ? 項目水平診斷 四、標準化學(xué)績測驗的題庫建設(shè) 一個高質(zhì)量的題庫應(yīng)具有的性質(zhì): ? 有一種科學(xué)的測量理論; ? 貯備一定數(shù)量的試題,所有試題品質(zhì)優(yōu)良,技術(shù)參數(shù)完備; ? 題庫內(nèi)部結(jié)構(gòu)層次清楚、分類嚴謹,試題檢索方便; ? 題庫管理方便,可控性強,易于維護更新; ? 保密性強。 五、我國高考的標準化試驗 第三節(jié) 教師自編課堂測驗 一、教師自編課堂測驗的特點 ? 測驗形式靈活多變,與測驗?zāi)康耐耆恢? ? 測驗內(nèi)容與教材內(nèi)容完全一致 ? 測驗難度切合學(xué)生的實際水平 ? 測驗編制簡易快速 二、教師自編課堂測驗的步驟與方法 ? 審查測驗?zāi)康? ? 制定測驗編制計劃 ? 命題與組卷 三、教師自編課堂測驗應(yīng)注意的問題 ? 教師要深入研究教材,深入研究學(xué)生 ? 要維護準確穩(wěn)定的合格標準 ? 要客觀評價自己的命題技術(shù),合理使用各種題型 ? 要注意總結(jié)命題經(jīng)驗,提高命題技術(shù) ? 要盡量控制評分誤差,防止簡單粗糙 ? 要做一些定量分析研究 第十章 能力測驗(上) 第一節(jié) 智力測驗的理論基礎(chǔ) (一)什么是智力? Spearman(1904,1923):智力是一種普遍的能力,它主要涉及 聯(lián)系的引出(eduction)和相關(guān)的引出。 Binet & Simon(1905):智力是正確進行理解、判斷和推理的能 力。 Terman(1916):智力是形成概念,并且抓住其重要性的能力。 Thorndike(1921):智力是從真理或事實角度產(chǎn)生良好反應(yīng)的能 力。 Thurstone(1921):智力是抑制本能反應(yīng),靈活地想象不同反應(yīng), 并且把修改后的本能反應(yīng)轉(zhuǎn)換為外顯行為的能力。 Wechsler(1939):智力是個體有目的地行動,理性地思考以及有 效地應(yīng)付環(huán)境的總體能力。 Piaget(1972):智力是總括性的術(shù)語,指用來適應(yīng)物理和社會環(huán) 境的認知結(jié)構(gòu)的組織和平衡的高級形式。 Sternberg(1985):智力是指自動信息加工和產(chǎn)生適合于新情況 的行為的心理能量,它包括元成分、操作成分和知識獲得成分。 Eysenck(1986):智力是將信息無錯地傳遞過皮層的能力。 Gardner(1986):智力是解決問題,制造在某些文化范圍內(nèi)有價 值的產(chǎn)品的能力或技術(shù)。 共同點: w智力是適應(yīng)環(huán)境的能力 w智力是通過經(jīng)驗進行學(xué)習(xí)的能力 w 智力是人們在獲得知識和運用知識解決實際問題時所必須具備的 心理條件或特征。 Boring(1923):智力就是智力測驗所測量的東西。 Sternberg等(1981)的研究 專家認為:語詞能力、問題解決能力和實際智能最重要 外行認為:實際問題解決能力、語詞能力和社會能力最重要 (二)智力的理論 Galton和感覺敏銳度 1.二因素論 Spearman的一般因素(G)和特殊因素(S) 2.多因素論 Thurstone的群因素(語文理解、言語流暢性、推理、空間想象、 數(shù)字、記憶、知覺速度) 3.二維結(jié)構(gòu)模型 希萊辛格和古特曼(1966) 第一維:言語能力、數(shù)學(xué)能力、圖形和空間能力 第二維:規(guī)則應(yīng)用能力、規(guī)則歸類的能力、學(xué)術(shù)成就 4. Cattell的流體智力與晶體智力 5. Gardner的多元智力理論 言語、邏輯-數(shù)學(xué)、空間、音樂、身體運動、社交、自知 6. Sternberg智力的認知心理學(xué)理論 智力成分:元成分、操作成分、知識獲得成分 智力情境:適應(yīng)環(huán)境、塑造環(huán)境、選擇新環(huán)境 智力經(jīng)驗:處理新任務(wù)、自動化加工 7. 其他: 情緒智力(EQ)、成功智力、實踐性智力(practical intelligence) 第二節(jié) 個體智力測驗 一、比內(nèi)量表 (一)比內(nèi)-西蒙量表 1.1905年量表 ? 世界上第一個智力量表; ? 內(nèi)容:30道題(記憶、言語、理解、手工操作)。 ? 題目排列方式:從易到難。 ? 指標:通過項目數(shù)。如白癡最多只能通過6項,低能的成人可通 過7~15項。 ? 眼睛是否隨動的物體移動。 ? 用觸覺刺激喚起抓握反應(yīng)。 ? 用視覺刺激喚起抓握反應(yīng)。 ? 辨認食物。 ? 搜尋食物。 ? 執(zhí)行簡單的命令和模仿簡單的手勢。 ? 認識物體。 ? 認識圖片。 ? 列舉圖片中的人物和物體。 ? 比較兩條線的長短。 ? 復(fù)述兩個數(shù)字。 ? 比較兩個重量。 ? 暗示。 ? 解說物體與人物的名稱。 ? 復(fù)述句子。 ? 說出二物的不同點。 ? 記憶圖片中的物體。 ? 靠記憶重畫圖片。 ? 復(fù)述數(shù)字。 ? 說出二物的相同點。 ? 比較線的長短。 ? 比較重量。 ? 重量記憶。 ? 說出同韻字。 ? 填詞。 ? 用三個詞造句。 ? 對答問句。 ? 交換長短針的位置。 ? 剪紙。 ? 抽象名詞的定義。 2.1908年量表 ? 內(nèi)容:增至59道題。 ? 方式:把測驗項目按年齡分組。每一歲一組。每個年齡組項目數(shù) 量不等,最多8項,最少3項。 ? 年齡范圍:3~13歲。 ? 指標:智力年齡。 3.1911年量表 ? 題目:刪舊補新,但總數(shù)仍為59題。 ? 增設(shè)一個成年組。 ? 除4歲組僅有4個項目外,其他每個年齡組一律為5項,便于計 算。 q 對比內(nèi)-西蒙量表的評價 成就: (1)比西量表是第一個采用復(fù)雜任務(wù)來測量高級心理過程的測驗。 以前的測驗主要測量感知覺、運動等低級心理過程。 (2)比西量表首次采用年齡作為智力的標準,這樣可以對測驗作出 通俗易懂的解釋。 (3)比西量表首次從整體上測量智力,也就是測量智力的普通因素, 而以往心理學(xué)家把感覺辨別力、記憶力、注意力等割裂開來測量。 不足: (1)施測和記分沒有標準化。 (2)常模團體的代表性不夠,因而有些項目的安排位置不當(dāng)。 (3)測驗項目過少。 (二)斯坦福-比內(nèi)量表 1.斯坦福-比內(nèi)量表的發(fā)展 (1)1916年量表 ? 在修改基礎(chǔ)上增設(shè)39個新項目,達到90個項目。 ? 最早對施測和記分提供了詳細的指導(dǎo)語。 ? 引入了智力商數(shù)的概念(比率智商)。 ? 適用年齡:3~13歲。 ? 樣本:1000名兒童和400名成人。 (2)1937年量表 ? 由 L 和 M 兩個等值型量表構(gòu)成 ? 年齡范圍擴大:1.5~18歲 ? 樣本:3184名1.5~18歲兒童,但僅限城市白人 (3)1960年量表 ? 合并了L和M兩型中最好的項目,改為單一量表。 ? 年齡:2~成人 ? 離差智商 ? 4498名1.5~18歲兒童(1937年量表的施測對象)。 (4)1972年量表 ? 測驗內(nèi)容未變; ? 取樣范圍擴大(地區(qū)、社會階層、經(jīng)濟狀況、民族)。 共2100名被試,其中2~5.5歲每半歲選100名,6~18歲每一歲 選100名。 2.斯比量表的信度和效度 (1)信度 ? 復(fù)本信度:L和M相關(guān)在0.83~0.95之間。 ? 再測信度:高于0.90。 (2)效度 ? 內(nèi)容效度:測驗內(nèi)容屬于公認的智力范疇。 ? 效標關(guān)聯(lián)效度:與學(xué)業(yè)成績、受教育年限的相關(guān)在0.4~0.75之間。 ? 結(jié)構(gòu)效度:假設(shè)智力發(fā)展隨年齡增長,先快后慢(證據(jù):隨年齡 增長,再測穩(wěn)定性逐步提高); 存在G因素(證據(jù):各項目與測驗總分的平均相關(guān)為0.66) (三)中國比內(nèi)測驗 陸志偉和吳天敏1924年、1936年、1982年三次修訂 內(nèi)容:51題 指標:離差智商 年齡范圍:2歲~18歲 ? 生活常識 ? 知覺速度及觀察力 ? 空間知覺力和想象力 ? 記憶力 ? 語言能力 ? 判斷推理能力 二、韋克斯勒(Wechsler)智力測驗 生平:1896年出生于羅馬尼亞,6歲遷居美國。一戰(zhàn)期間從事心 理測驗工作,用陸軍甲、乙種測驗、斯比量表來甄選新兵,積累 了豐富的經(jīng)驗。 1919年去倫敦大學(xué),師從Spearman和Pearson, 接受G因素理論。1920~1922年在巴黎與西蒙有過接觸。1925 年,在哥倫比亞大學(xué)獲博士學(xué)位,論文《情緒反應(yīng)的測量》。 1932~1967年,任紐約貝爾韋精神病院的主任心理學(xué)家。 編制背景:尋找一種測量成人智力的有效方式。當(dāng)時的智力測驗存在 下列問題: ? 測驗項目引不起成人的興趣; ? 過多的項目涉及語詞的操作; ? 指導(dǎo)語過分強調(diào)速度,犧牲了準確性; ? 計算心理年齡,不適合成人測驗要求。 IQ=測驗者的實際測驗分數(shù)-這一年齡測驗者的平均測驗分數(shù) 韋氏智力測驗家族: 1939年,韋克斯勒-貝利弗測驗 1946年,韋克斯勒-貝利弗測驗Ⅱ 1949年,韋克斯勒兒童智力量表(WISC) 1955年,韋克斯勒成人智力量表(WAIS) 1967年,韋克斯勒學(xué)前和小學(xué)兒童智力量表(WPPSI) 1974年,韋克斯勒兒童智力量表修訂版(WISC-R) 1981年,韋克斯勒成人智力量表修訂版(WAIS-R) 1989年,韋克斯勒學(xué)前和小學(xué)兒童智力量表(WPPSI-R) 1991年,韋克斯勒兒童智力量表第三版(WISC- Ⅲ ) 韋氏測驗的特點: (1)10~12個分測驗:使用多個分測驗,不僅可以得到總IQ,還可 以分析個體在智力上的強項和弱點; (2)言語量表和操作量表各由5~6個分測驗組成,可以單獨評價言 語或操作的各項智力成分,體現(xiàn)了左右腦功能的整合,而且可以 顯示個體的職業(yè)能力傾向。 (3)共同的IQ計分系統(tǒng):對所有測驗和所有年齡組,IQ平均為100, 標準差為15。而且每個分測驗的平均分為10,標準差接近3分。 這樣就可以比較被試的各項分測驗分數(shù),了解其相對強弱。 (4)不同年齡組有相同的分測驗:例如,WAIS-R,WISC-R,WPPSI-R 有相同的8個核心分測驗。這不僅方便施測者,而且有助于測驗 之間的相互比較。 韋克斯勒測驗的分測驗 (1)常識(information) 33個一般知識性問題,如“誰發(fā)現(xiàn)了美洲?”“我國的首都在哪 里?” “兒童節(jié)是哪一天?” 得分越高,說明興趣越廣泛,好奇心強,長時記憶好。 把該測驗放在首位,容易與被試建立關(guān)系,不易引起被試的緊張 和厭煩。 (2)數(shù)字廣度(digit span) 分順背和倒背兩部分(2位到9位數(shù))。 主要測查瞬時記憶能力。對智力低者,測其智力;對智力高者, 測其注意力。 按0或1計分,總分為兩部分之和。 智力高者在該項上得分未必高,有時倒背可能會高于順背成績。腦功能障礙者一般得分較低。但對有些白癡學(xué)者,能輕易得高 (3)詞匯(vocabulary) 要求被試定義和解釋通過視覺或聽覺呈現(xiàn)給他們的字詞的一般 意義。例如“什么是杯子?”“什么是美麗?” 該測驗與抽象概括能力有關(guān)。年齡大的、智力高的、受教育程度 高的、經(jīng)歷豐富的人,其得分高。 問題是計分困難。答案分四級: 一級:用同義詞,且能說明二者的細微差別; 二級:具體運用詞匯來造句; 三級:望文生義,作字面解釋; 四級:做手勢或指實物給主試看。 一級計2分,二級計1分,三四級計0分。 (4)算術(shù)(arithmetic) 簡單項目主要是加減法運算。難一些的問題需要對問題進行分 析,并運用兩種以上的算術(shù)運算。 主要測量基本的數(shù)理知識和數(shù)學(xué)思維、推理能力。 (5)理解(comprehension) 容易的題目主要測常識,如“為什么人要穿衣服?” 難的項目需要了解社會、文化傳統(tǒng),如“為什么最高法院任命終 身法官?” 該分測驗?zāi)芊从潮辉噷τ谏鐣r值取向、風(fēng)俗、倫理道德是否理 解和適應(yīng),在臨床上可以鑒別腦器質(zhì)性障礙的病人。 (6)類同(similarities) 讓被試區(qū)分物體、事實和觀念的重要的相似性與不重要的相似 性,如“襯衫和襪子有什么相似的地方?”測查個體的邏輯思維、 抽象思維、分析和概括能力。 (7)填圖(picture completion) 要求被試回答圖中缺少了什么重要成分。主要測的是記憶、細節(jié) 注意能力和視覺敏銳性。 具有病態(tài)觀念的患者往往將自己的思想投射到測驗中去。智力落 后者的填圖成績很差。 (8)句子(sentences) 要求被試逐字重復(fù)主試大聲讀出的句子。 測查注意和記憶能力。 (9)幾何圖形(geometric design) 10個圖案,每個圖形由一個圓、一個正方形和一個菱形組成, 讓兒童復(fù)寫。 (10)動物房(animal pegs) 把某種顏色的圓錐(黑、白、黃、藍)放到合適的動物(狗、小 雞、貓、魚)的洞里。測查學(xué)習(xí)能力、手的靈活性、維持注意的 能力。 (一)韋氏成人智力量表 共有11個分測驗,其中6個言語量表(常識、數(shù)字廣度、詞匯、 算術(shù)、理解和類同),5個操作量表(填圖、圖片排列、積木圖 案、物體拼湊、數(shù)字符號) q 信度和效度 ? 背數(shù)和數(shù)字符號分測驗計算復(fù)本信度,其余部分計算分半信度, 為0.88~0.98 ? 結(jié)構(gòu)效度:“從各個方面來測量智力,而不是測量不同類型的智力。” 因素分析表明,有50%的變異來自智力一般因素;各分測驗之間 和分量表之間存在普遍的顯著的正相關(guān),表明智力G因素滲透于 智力行為的各個方面。 ? 內(nèi)容效度:測驗項目均取自或參照前人成功用過的量表(比內(nèi)量 表、陸軍a和b)編制。 ? 效標關(guān)聯(lián)效度:與斯比量表的相關(guān)0.80;文職人員的言語智商高 于操作智商,技術(shù)工人則相反。 (一)韋氏成人智力量表 共有11個分測驗,其中6個言語量表(常識、數(shù)字廣度、詞匯、 算術(shù)、理解和類同),5個操作量表(填圖、圖片排列、積木圖 案、物體拼湊、數(shù)字符號) q 信度和效度 ? 背數(shù)和數(shù)字符號分測驗計算復(fù)本信度,其余部分計算分半信度, 為0.88~0.98 ? 結(jié)構(gòu)效度:“從各個方面來測量智力,而不是測量不同類型的智力。” 因素分析表明,有50%的變異來自智力一般因素;各分測驗之間 和分量表之間存在普遍的顯著的正相關(guān),表明智力G因素滲透于 智力行為的各個方面。 ? 內(nèi)容效度:測驗項目均取自或參照前人成功用過的量表(比內(nèi)量 表、陸軍a和b)編制。 ? 效標關(guān)聯(lián)效度:與斯比量表的相關(guān)0.80;文職人員的言語智商高 于操作智商,技術(shù)工人則相反。 (二)韋氏兒童智力量表 ? 12個分測驗:5個言語測驗(常識、類同、算術(shù)、詞匯、理解), 5個操作測驗(填圖、圖片排列、積木圖案、拼圖、譯瑪),2個備 用測驗(背數(shù)和迷津)。 ? 適用年齡:6~16歲 ? 分半信度:0.70~0.86 ? 再測信度:0.65~0.88 ? 效標關(guān)聯(lián)效度:以年齡為效標,得分隨年齡增長而提高。與學(xué)績 測驗或其他學(xué)業(yè)行為的相關(guān)為0.50~0.60;與斯比量表的相關(guān)為 0.60~0.71 ? 結(jié)構(gòu)效度:發(fā)現(xiàn)智力一般因素的存在 q 韋克斯勒兒童智力量表(WISC-R)中國修訂本 ? 修訂者:林傳鼎、張厚粲等(1983年) ? 模:中等以上城市(3000人) ? 修訂原則:測題要適合中國兒童的特點;改動的測題盡可能與原 題性質(zhì)類似、難度接近。主要改動有: (1)我國社會中不常見的或我國兒童不熟悉的測題內(nèi)容,如“一個鎳 幣等于幾便士?”“美國成年男子平均身高是多少?” (2)不合我國國情的,如“為什么把錢交給慈善機關(guān)比施舍給街頭乞 丐好?” (3)由于語種不同,翻譯后在難度上發(fā)生變化的,如“三月過后是幾 月?”“啤酒和黃酒的共同點是什么?” (4)凡外國人名、貨幣名稱以及圖片上的人物等盡量使之中國化。 言語量表:常識、背數(shù)、詞匯、算術(shù)、理解、類同 操作量表:填圖、圖畫排列、積木圖案、拼圖、譯碼、迷津 (三)韋氏幼兒智力量表(WPPSI) ? 年齡:4~6.5歲 ? 11個分測驗:5個言語測驗(常識、理解、詞匯、算術(shù)、類同), 5個操作測驗(填圖、迷津、積木圖案、句子復(fù)述),2個備用測驗 (動物房、幾何圖案)。 ? 分半信度: ? 再測信度 ? 結(jié)構(gòu)效度:G ? 效標關(guān)聯(lián)效度:與斯比量表的相關(guān) ? 對韋氏量表的評價 優(yōu)點: (1)具有復(fù)雜的結(jié)構(gòu),能夠較好地反映智力的整體和各個側(cè)面; (2)各年齡組都接受相同的分測驗,可以相互比較,并節(jié)省指導(dǎo)測 驗的時間; (3)用離差智商代替比率智商,克服了計算成人智商的困難。 (4)采用因素分析法研究結(jié)構(gòu)效度更具有理論意義。 (5)各量表之間相互銜接,適用的年齡范圍可以從幼兒直到老年。 缺點: (1)施測程序復(fù)雜費時; (2)對于測量智力極高或極低的被試不大適用; (3)缺乏充分的效度資料。 第三節(jié) 團體智力測驗 一、陸軍測驗 一戰(zhàn)時在Yerkes領(lǐng)導(dǎo)下編制。 q 陸軍甲種(α)測驗 ? 8個分測驗: 照令行事、算術(shù)、常識、異同(同反義詞)、字句重組、填數(shù)、類比推理、理解 ? 效度:與軍官評定、斯比量表、教師評定、學(xué)業(yè)成績的相關(guān) q 陸軍乙種(β)測驗 ? 7個分測驗:迷津、立方體分析、補足數(shù)列、譯碼、數(shù)字校對、圖畫補缺、幾何形分析 ? 測試對象:母語非英語的被試和文盲被試 ? 效度:與甲種測驗的相關(guān) 二、瑞文推理測驗 (一)瑞文推理測驗的產(chǎn)生與發(fā)展 1.瑞文標準推理測驗 ? 6歲以上 ? 5個系列,60個項目 A組測知覺辨別力、圖形比較、圖形想象 B組測類同、比較、圖形組合 C組測比較、推理、圖形組合 D組測系列關(guān)系、圖套組合 E組測套合、互換等抽象思維能力 2.瑞文彩圖推理測驗 ? 5~11歲 ? 3個系列,36個項目 3.瑞文高級推理測驗 ? 適合于高智力成人 ? 第一套12個項目,第二套36個項目 (二)瑞文標準推理測驗中國修訂本 修訂者:張厚粲(1985年) 取樣:大、中、小城市 年齡:5歲~成人 信度:分半信度、再測信度 效度:與WISC-RC、高考成績的相關(guān)。 聯(lián)合型瑞文測驗(CRT,Combined Raven’s Test) (彩色+標準) 團體施測的適用范圍:三年級以上,65歲以下 三、認知能力測驗 桑代克 初級型:口頭、詞匯、關(guān)系概念、多重智力和數(shù)量概念 文字測驗:詞匯、句子填充、語詞分類、語詞類推 數(shù)量測驗:數(shù)的大小比較、數(shù)列補充、建立關(guān)系 非文字測驗:圖形分類、圖形推理、圖形綜合 第四節(jié) 嬰幼兒智力測驗 一、蓋塞爾發(fā)展順序量表 適用年齡:出生~36個月 方式:自然情景下對兒童的觀察 測試工具:響鈴、三色環(huán)、撥浪鼓、積木、搖鈴、蠟筆和紙、皮球、顏色板等 評定內(nèi)容: ? 動作:分大動作和細動作。大動作指身體的姿態(tài)、頭的平衡、坐、立、爬、走、跑、跳,細動作指手指的運用。 ? 言語:聽、理解和表達 ? 環(huán)境適應(yīng):如對物體和環(huán)境的精細感覺、協(xié)調(diào)能力 ? 社會應(yīng)答:與人交往 診斷依據(jù):每個成熟階段的行為模式。 指標:DQ(發(fā)育商數(shù)) = 測得的成熟年齡/實際年齡 2歲小孩的動作發(fā)育:逐頁翻書、疊起7~8塊積木、用積木接成火 車、把盛滿水的杯子給人、學(xué)畫圈、能說出4樣畫片的名稱、踢球、 跑且不摔交 嬰幼兒智能發(fā)育階段初步檢查表 關(guān)鍵年齡 成熟階段 動作能 應(yīng)物能 言語能 應(yīng)人能 4周 仰臥 不能控制頭部,仰臥姿勢左右不對稱 眼光能短暫跟 隨人、物,給玩具立即放棄 面部無表情,喉頭作微聲 凝 視四周,“傾聽聲音” 16周 仰臥 頸可豎直,頭微搖動,仰臥姿勢左右對稱 開始接 近有響聲的玩具,注視手中有響聲的玩具 發(fā)出咕咕聲,出 聲笑 動微笑迎人,玩弄己手 28周 坐 扶起獨坐,身體前傾 伸手拿玩具,能將玩具自一手 遞交他手 呼號,哭時作“姆姆”聲 將足置于口中 40周 坐 可獨坐,爬行,扶著物件站立 能將兩樣玩具放在一 起,平指摘小丸 能呼爸爸媽媽,除爸媽外能說另一字 懂 得成人逗玩,能自己吃- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測量學(xué) 教案
鏈接地址:http://m.appdesigncorp.com/p-10029949.html