心理測(cè)量學(xué)(基礎(chǔ)知識(shí)).ppt
《心理測(cè)量學(xué)(基礎(chǔ)知識(shí)).ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《心理測(cè)量學(xué)(基礎(chǔ)知識(shí)).ppt(147頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1 心理測(cè)量學(xué) 2 上篇 什么是心理測(cè)量學(xué) 心理測(cè)量起于行為主義盛行的時(shí)代 人的心理在相當(dāng)程度上被看成是與一般動(dòng)物的心理活動(dòng)有同樣的本質(zhì) 所以是可以操控和測(cè)量的 但是我們今天看到 隱秘 深邃 有限而又無限 社會(huì)文化使得人類個(gè)體的行為遠(yuǎn)離動(dòng)物行為的刻板模式 更具有隨機(jī)性而似乎不可確定 還是可以測(cè)量的嗎 是的 可以 言必由衷 行必有因 言與行提供了人類心靈評(píng)估的標(biāo)尺 基于此 心理測(cè)量依然成為當(dāng)代心理學(xué)工作者的有效技術(shù)了 返回首頁 3 目錄 第一節(jié)概述第二節(jié)心理測(cè)驗(yàn)的常模第三節(jié)心理測(cè)驗(yàn)的信度第四節(jié)心理測(cè)驗(yàn)的效度第五節(jié)心理測(cè)驗(yàn)的項(xiàng)目分析第六節(jié)心理測(cè)驗(yàn)的編制程序第七節(jié)心理測(cè)驗(yàn)的使用 退出 4 第一節(jié)心理測(cè)量學(xué)概述 心理測(cè)量學(xué)是心理學(xué)的基本方法學(xué)課程之一 它主要討論如何借助于標(biāo)準(zhǔn)化的心理測(cè)量工具 心理測(cè)驗(yàn)對(duì)個(gè)體的心理特征或心理狀態(tài)進(jìn)行評(píng)估 并將其數(shù)量化的過程 因此 它基本的和重點(diǎn)的內(nèi)容在于心理測(cè)驗(yàn)的編制方法 質(zhì)量評(píng)估 實(shí)際應(yīng)用和結(jié)果解釋 以及經(jīng)典測(cè)驗(yàn)的介紹和使用 5 一心理測(cè)量的涵義 要素與量表 1 心理測(cè)量及其構(gòu)成元素 事物總在不斷地運(yùn)動(dòng)變化 而其運(yùn)動(dòng)變化表現(xiàn)為多種屬性在質(zhì)或量上的改變 這些可變的事物的屬性叫變量 利用一定的規(guī)則 方法或工具 使事物的屬性數(shù)量化 即確定一系列事物的屬性值 就叫測(cè)量 其構(gòu)成元素有 事物 即事物的屬性 規(guī)則 數(shù)字 規(guī)則 則是指這一過程具有科學(xué)依據(jù) 確定的程序和量化的標(biāo)準(zhǔn) 數(shù)字 一般具有 同一性或區(qū)分性 等級(jí)性或位次性 等距性 可加性 當(dāng)被測(cè)量的變量是反映心理活動(dòng)的屬性或特征時(shí) 這種測(cè)量就叫心理測(cè)量 如 記憶力測(cè)量 氣質(zhì)類型測(cè)量 焦慮水平測(cè)量等 P348 6 2 心理測(cè)量的基本要素 測(cè)量有兩個(gè)基本要素 參照點(diǎn)和單位 其中參照點(diǎn)是測(cè)量過程計(jì)算量的起點(diǎn) 包括絕對(duì)和相對(duì)參照點(diǎn) 絕對(duì)參照點(diǎn)就是絕對(duì)零點(diǎn) 相對(duì)參照點(diǎn)則根據(jù)情境來人為規(guī)定 也叫相對(duì)零點(diǎn) 單位是測(cè)量中的等值單元 它必須具備兩個(gè)條件 有確定的意義 有相同的價(jià)值 就心理測(cè)量來說 第一 測(cè)量中幾乎沒有絕對(duì)零點(diǎn) 大多是以相對(duì)零點(diǎn)來計(jì)算的 第二 測(cè)量中很少有相等單位 所以在對(duì)測(cè)量值進(jìn)行解釋時(shí)更多看其相對(duì)意義 或?qū)y(cè)量結(jié)果等值轉(zhuǎn)換形成相等單位 當(dāng)然 心理測(cè)量常以行為測(cè)量來完成 而行為測(cè)量中是可以有絕對(duì)零點(diǎn)和相等單位的 如學(xué)習(xí)能力無絕對(duì)零點(diǎn) 但考試成績有零分 P349 7 3 測(cè)量量表及其種類 如將事物某一屬性的可能取值全部列出并按其相對(duì)位置排列 就構(gòu)成了一個(gè)測(cè)量標(biāo)尺 這一標(biāo)尺就叫測(cè)量量表 measurescale 按照測(cè)量量表是否具有絕對(duì)零點(diǎn) 相等單位 以及測(cè)量所得數(shù)值的對(duì)比關(guān)系 我們可以將測(cè)量量表劃分為四種 1 命名量表 也叫稱名量表 2 順序量表 也叫等級(jí)量表 3 等距量表 4 等比量表這里需要注意 1 各種量表值的意義 2 各種量表的量化水平 3 各種量表測(cè)量值允許的運(yùn)算 加 減 乘 除 4 心理測(cè)量大多是在順序量表上進(jìn)行的 P349 8 能夠用來完成心理測(cè)量的標(biāo)準(zhǔn)化工具或程序叫心理測(cè)驗(yàn) 也叫心理量表 定義 心理學(xué)家依據(jù)一定心理學(xué)理論和系統(tǒng)觀察 取樣 而精心編制的一系列刺激項(xiàng)目及其標(biāo)準(zhǔn)化形式 就叫心理測(cè)驗(yàn) 心理測(cè)量就是心理測(cè)驗(yàn)的使用過程 它是收集個(gè)體對(duì)這一系列刺激項(xiàng)目的反應(yīng)資料 進(jìn)而對(duì)其心理特征 能力及其他心理結(jié)構(gòu)進(jìn)行評(píng)定的過程 所以從某種意義上說 心理測(cè)量就是從人的眾多相關(guān)行為中進(jìn)行取樣 然后由這一行為樣本推斷其心理品質(zhì)或心理狀態(tài) 二 心理測(cè)驗(yàn)的基本概念 1 什么叫做心理測(cè)驗(yàn) P350 9 為理解心理測(cè)驗(yàn) 再強(qiáng)調(diào)三點(diǎn) 第一 心理測(cè)驗(yàn)所提供的是一系列刺激項(xiàng)目 借此收集被試對(duì)這些刺激的反應(yīng)資料 所以心理測(cè)驗(yàn)實(shí)際上是進(jìn)行行為取樣的過程 為使收集來的行為資料意義較確定 測(cè)驗(yàn)項(xiàng)目應(yīng)具體 直接 語義單一 盡量不使用含糊 抽象和有較大不確定性的問題 第二 測(cè)驗(yàn)不需要涉及某類行為的所有方面 而要有所選擇 即要進(jìn)行行為取樣 選取那些能有效反映所想要測(cè)量的心理特征或傾向 第三 測(cè)驗(yàn)應(yīng)是標(biāo)準(zhǔn)化的 即其編制 施用 評(píng)分和結(jié)果解釋都必須按照系統(tǒng)程序和科學(xué)化的規(guī)則來進(jìn)行 P350 10 心理測(cè)驗(yàn)的三要素 第一 行為樣組 心理測(cè)量是通過個(gè)體一組相關(guān)的行為測(cè)量間接完成的 所以其成功與否 或準(zhǔn)確性高低 取決于心理測(cè)驗(yàn)中的行為取樣的有效性 第二 標(biāo)準(zhǔn)化 心理測(cè)量更看重個(gè)體間測(cè)量結(jié)果的比較關(guān)系 為了使得測(cè)量結(jié)果具有可比性 心理測(cè)驗(yàn)必須標(biāo)準(zhǔn)化 第三 客觀性 客觀性是指測(cè)量結(jié)果較少受到主觀的 其他偶然因素影響 而獲得可靠結(jié)果 進(jìn)行良好的行為取樣和進(jìn)行標(biāo)準(zhǔn)化 都是為了保證測(cè)量結(jié)果的客觀性 P350 11 心理測(cè)驗(yàn)的特點(diǎn)決定了心理測(cè)量的性質(zhì) 第一 因?yàn)樾睦頊y(cè)驗(yàn)提供的是一個(gè)刺激序列 使用測(cè)驗(yàn)所獲得的是人對(duì)這一刺激系列的反應(yīng)資料 然后再推斷其內(nèi)在的心理特質(zhì) 所以心理測(cè)量具有間接性 第二 針對(duì)測(cè)驗(yàn)的刺激項(xiàng)目 我們獲得的主要是被試對(duì)刺激的反應(yīng)傾向或反應(yīng)強(qiáng)度 不具有絕對(duì)零點(diǎn)和絕對(duì)意義 只具有相對(duì)意義 所以心理測(cè)量具有相對(duì)性 第三 測(cè)驗(yàn)中的項(xiàng)目選擇 施測(cè)程序 結(jié)果的分析與解釋均是經(jīng)過標(biāo)準(zhǔn)化的 這決定了心理測(cè)量具有相對(duì)的可靠性 即具有客觀性 P351 12 2 心理測(cè)驗(yàn)的分類 按測(cè)驗(yàn)的功能或目標(biāo)不同 智力測(cè)驗(yàn) 特殊能力測(cè)驗(yàn) 人格測(cè)驗(yàn)按測(cè)驗(yàn)材料的性質(zhì)不同 文字測(cè)驗(yàn) 操作測(cè)驗(yàn)按測(cè)驗(yàn)材料的嚴(yán)謹(jǐn)程度不同 客觀測(cè)驗(yàn) 投射測(cè)驗(yàn)按測(cè)驗(yàn)的方式不同 個(gè)別測(cè)驗(yàn) 團(tuán)體測(cè)驗(yàn)按測(cè)驗(yàn)對(duì)被試要求的不同 最高作為測(cè)驗(yàn) 典型行為測(cè)驗(yàn)按測(cè)驗(yàn)的目的不同 描述性測(cè)驗(yàn) 診斷性測(cè)驗(yàn) 預(yù)測(cè)性測(cè)驗(yàn) P353 13 三 如何看待心理測(cè)驗(yàn) 第一 萬能論 心理測(cè)驗(yàn)測(cè)驗(yàn)完美無缺 可以解決一切問題 第二 無用論 侵犯隱私 違背民主原則 種族歧視 宿命論等 第三 心理測(cè)驗(yàn)就是智力測(cè)驗(yàn) 心理測(cè)驗(yàn) 智力測(cè)驗(yàn) 智商 遺傳決定論 錯(cuò)誤看法 P351 14 正確看法 第一 心理測(cè)驗(yàn)是心理學(xué)研究和實(shí)際工作中的有效工具 可以幫助人們收集有關(guān)人的心理特征 心理狀態(tài)的資料 獲得對(duì)人的心理活動(dòng)規(guī)律性的認(rèn)知和進(jìn)行科學(xué)決策 第二 心理測(cè)驗(yàn)作為研究方法和測(cè)量工具 尚不完善 其使用中會(huì)帶來系統(tǒng)的和隨機(jī)的誤差 所以可信但不能全信 可靠但不是絕對(duì)可靠的 無用論 和 萬能論 都是錯(cuò)誤的 第三 心理測(cè)驗(yàn)不等于智力測(cè)驗(yàn) 更不能說成是 遺傳決定論 P351 15 四 心理測(cè)驗(yàn)在心理咨詢中的應(yīng)用 1 心理測(cè)驗(yàn)與心理咨詢的關(guān)系 心理測(cè)驗(yàn)對(duì)心理咨詢的影響 1 提供關(guān)于個(gè)體心理特質(zhì) 心理狀態(tài) 心理發(fā)展的客觀資料 為教育心理咨詢 發(fā)展預(yù)測(cè)咨詢 職業(yè)指導(dǎo)提供依據(jù) 2 作為診斷 甄別與療效評(píng)估的工具 使心理咨詢具有更高的操作性 針對(duì)性和有效性 3 巧妙使用 可以作為心理咨詢與治療的手段之一 達(dá)到意想不到的效果 心理咨詢對(duì)心理測(cè)驗(yàn)的影響 1 心理咨詢與治療實(shí)踐的需要直接刺激和推動(dòng)了心理測(cè)驗(yàn)的發(fā)展 2 心理咨詢與治療過程獲得的資料豐富和推動(dòng)了心理學(xué)理論和測(cè)驗(yàn)技術(shù)的完善與發(fā)展 P355 16 2 我國心理咨詢中運(yùn)用較多的心理測(cè)驗(yàn) 1 智力測(cè)驗(yàn) 比奈智力測(cè)驗(yàn) 韋克斯勒智力測(cè)驗(yàn) 瑞文標(biāo)準(zhǔn)推理測(cè)驗(yàn)等 測(cè)查智力發(fā)展水平或進(jìn)行智障診斷 2 人格測(cè)驗(yàn) 艾森克人格問卷 EPQ 卡特爾16種人格因素問卷 16PF 明尼蘇達(dá)多項(xiàng)人格調(diào)查表 MMPI 等 這些測(cè)驗(yàn)可以達(dá)到了解 診斷和預(yù)測(cè)的目的 3 心理評(píng)定量表 精神病評(píng)定量表 躁狂狀態(tài)評(píng)定量表 抑郁量表 恐怖量表等 這些測(cè)驗(yàn)主要用來進(jìn)行臨床診斷和療效評(píng)估 P355 17 五 心理測(cè)驗(yàn)的發(fā)展簡史 1 現(xiàn)代心理測(cè)驗(yàn)的開始 1 英國的高爾頓 F Galton 受達(dá)爾文進(jìn)化論的影響 最早關(guān)注個(gè)體氣質(zhì)特點(diǎn)與智能差異 即個(gè)性差異 為了研究差異的遺傳性 設(shè)計(jì)了差異測(cè)量的方法 這可被看作是心理測(cè)驗(yàn)的開端 高爾頓提出相關(guān)的概念 并由他的學(xué)生皮爾遜 K Pearson 發(fā)展出積差相關(guān) 為心理測(cè)驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ) 使心理測(cè)驗(yàn)的信度 效度評(píng)估和進(jìn)行因素分析成為可能 其實(shí)際測(cè)量集中在1884后的6年 波林 在測(cè)驗(yàn)領(lǐng)域 19世紀(jì)80年代是高爾頓的10年 90年代是卡特爾的10年 20世紀(jì)頭10年則是比內(nèi)的10年 P357 18 2 心理測(cè)驗(yàn)的概念和標(biāo)準(zhǔn)化思想的提出 美國著名心理學(xué)家卡特爾 JamesM Cattell 于1890年在 心理 雜志上發(fā)表 心理測(cè)驗(yàn)與測(cè)量 首次正式提出 心理測(cè)驗(yàn) mentaltest 的概念 并強(qiáng)調(diào)了心理測(cè)驗(yàn)標(biāo)準(zhǔn)化 制訂常模的重要性 P357 19 3 世界上第一個(gè)正式的心理測(cè)驗(yàn) 1904年 法國公共教育部成立了一個(gè)專門研究學(xué)習(xí)落后兒童教育方法的委員會(huì) 比奈 A Binet 成為該委員會(huì)成員 他開始著手制訂有效方法來甄別學(xué)校中那些學(xué)習(xí)成績差者 哪些是由于智力落后造成的 在西蒙 T Simon 醫(yī)生協(xié)助下 比奈于次年發(fā)表 診斷異常兒童智力的新方法 公布一個(gè)由30個(gè)項(xiàng)目組成的粗略量表 這就是第一個(gè)正式的智力測(cè)驗(yàn) 被稱為比奈 西蒙智力測(cè)驗(yàn) 比內(nèi)在1908年發(fā)表修訂版測(cè)驗(yàn)時(shí) 第一次使用了心理年齡 mentalage 簡稱MA 的概念 P358 20 比奈智力量表后傳到美國 經(jīng)斯坦福大學(xué)的推孟 Terman 教授修訂于1916年發(fā)表了被廣泛使用的智力測(cè)驗(yàn) 即斯坦福 比奈智力量表 該量表第一次提出了智力商數(shù)的概念 簡稱智商 intelligenceratio 簡稱IQ 比內(nèi)的主要工作從1898年發(fā)表 人格心理學(xué)中的測(cè)量 提出許多測(cè)驗(yàn)開始直至1911年去世 去世當(dāng)年發(fā)表了他的智力測(cè)驗(yàn)的第二次修訂版 P358 21 2 現(xiàn)代心理測(cè)驗(yàn)的發(fā)展 1 操作測(cè)驗(yàn)的發(fā)展 比奈 西蒙量表以言語測(cè)驗(yàn)為主 制約了對(duì)整體智力的測(cè)驗(yàn)和測(cè)驗(yàn)向某些人群的推廣 于是出現(xiàn)操作性測(cè)驗(yàn) 2 團(tuán)體智力測(cè)驗(yàn)的發(fā)展 第一次世界大戰(zhàn)之前 主要是屬于個(gè)人測(cè)驗(yàn) 后因戰(zhàn)爭需要 團(tuán)體智力測(cè)驗(yàn)迅速發(fā)展 3 能力傾向測(cè)驗(yàn)的發(fā)展 20世紀(jì)30年代 因素分析技術(shù)使智力結(jié)構(gòu)理論迅速發(fā)展 促進(jìn)了智力測(cè)驗(yàn) 特別是能力傾向測(cè)驗(yàn)的發(fā)展 4 人格測(cè)驗(yàn)的發(fā)展 20世紀(jì)40年代 由于社會(huì)動(dòng)蕩 人格障礙成為社會(huì)生活中的突出問題 這推動(dòng)了人格理論的繁榮和發(fā)展 也進(jìn)而推動(dòng)了人格測(cè)驗(yàn)的發(fā)展 P358 22 3 現(xiàn)代心理測(cè)驗(yàn)在中國的發(fā)展 在20世紀(jì)二三十年代 我國早期心理學(xué)家進(jìn)行了比奈智力量表的引進(jìn)和修訂工作 陳鶴琴等著名心理學(xué)家進(jìn)行了大量教育心理的測(cè)驗(yàn)和研究工作 后因抗戰(zhàn)爆發(fā) 測(cè)驗(yàn)工作處于停滯 建國后的最初幾年 心理測(cè)驗(yàn)也得到發(fā)展 但后因?qū)W習(xí)蘇聯(lián)批判兒童學(xué) 連帶兒童學(xué)的研究方法 心理測(cè)驗(yàn)也受到批判 進(jìn)入20世紀(jì)80年代后 我國的心理測(cè)驗(yàn)得到順利發(fā)展 主要進(jìn)行了智力與人格量表的引進(jìn)和修訂 近年 主要致力于測(cè)驗(yàn)的本土化工作 編制適合于我國文化背景的智力測(cè)驗(yàn) 適應(yīng)行為量表等 P358 23 1 用心理量表將心理現(xiàn)象數(shù)量化的方法是 A 個(gè)案法B 會(huì)談法C 觀察法D 測(cè)量法2 測(cè)量的二要素是 A 行為樣組B 參照點(diǎn)C 客觀性D 標(biāo)準(zhǔn)化E 單位3 測(cè)量結(jié)果可以進(jìn)行加減乘除運(yùn)算的量表是 A 命名量表B 順序量表C 等距量表D 等比量表4 心理測(cè)驗(yàn)的要素是 A 行為樣組B 參照點(diǎn)C 客觀性D 標(biāo)準(zhǔn)化E 單位5 心理測(cè)驗(yàn)或心理測(cè)量的性質(zhì)包括 A 神秘性B 間接性C 準(zhǔn)確性D 客觀性E 相對(duì)性 返回目錄 本節(jié)學(xué)習(xí)檢測(cè)題 24 6 按測(cè)驗(yàn)的功能或目標(biāo)分類 心理測(cè)驗(yàn)包括 A 個(gè)人測(cè)驗(yàn)B 智力測(cè)驗(yàn)C 文字測(cè)驗(yàn)D 特殊能力測(cè)驗(yàn)E 人格測(cè)驗(yàn)7 下列有關(guān)心理測(cè)驗(yàn)性質(zhì)的描述哪項(xiàng)是正確的 A 心理測(cè)驗(yàn)可以直接反映心理品質(zhì)的量B 心理測(cè)驗(yàn)分?jǐn)?shù)是心理品質(zhì)的相對(duì)估計(jì)C 心理測(cè)驗(yàn)分?jǐn)?shù)是絕對(duì)客觀的 沒有主觀因素參與D 如果兩個(gè)人的測(cè)驗(yàn)分?jǐn)?shù)相等 那么他們的心理品質(zhì)也完全相同8 根據(jù)測(cè)驗(yàn)?zāi)康?可將心理測(cè)驗(yàn)劃分為預(yù)測(cè)性 診斷性和 等形式 A 文字性B 非文字性C 計(jì)劃性D 描述性9 我國心理門診運(yùn)用較多的心理測(cè)驗(yàn)主要有 A 智力測(cè)驗(yàn)B 管理能力測(cè)驗(yàn)C 人格測(cè)驗(yàn)D 心理評(píng)定量表E 團(tuán)體智力測(cè)驗(yàn) 返回目錄 25 10 最早關(guān)注個(gè)別差異測(cè)量并提出相關(guān)概念的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟11 最早提出 心理測(cè)驗(yàn) 概念 并強(qiáng)調(diào)要建立常模的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟12 完成了第一個(gè)正式心理測(cè)驗(yàn)編制的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟13 最早使用智力商數(shù)概念的學(xué)者是 A 高爾頓B 卡特爾C 比內(nèi)D 推孟14 在比 西測(cè)驗(yàn)問世后 心理測(cè)驗(yàn)的主要發(fā)展為 A 操作測(cè)驗(yàn)的發(fā)展B 團(tuán)體測(cè)驗(yàn)的發(fā)展C 能力傾向測(cè)驗(yàn)的發(fā)展D 人格測(cè)驗(yàn)的發(fā)展 返回目錄 26 第二節(jié)測(cè)驗(yàn)的常模 常模 就是常定模具 是衡量被試分?jǐn)?shù)相對(duì)高低的固定對(duì)照 模板 它由 原始分 與 導(dǎo)出分 組成 實(shí)際上就是 測(cè)驗(yàn)所得原始分 與 在相應(yīng)人群中該分排位的等級(jí) 的對(duì)照表 導(dǎo)出分也叫常模分 是根據(jù)常模樣本施測(cè)的分?jǐn)?shù)計(jì)算出來的 然后就成為評(píng)估被試測(cè)驗(yàn)分?jǐn)?shù)的標(biāo)準(zhǔn)或基礎(chǔ) 導(dǎo)出分是具有參照點(diǎn)和單位的一個(gè)意義明顯的測(cè)驗(yàn)量表 是一個(gè)排位值 當(dāng)被試參加測(cè)驗(yàn) 得到了原始分?jǐn)?shù)之后 與常模對(duì)照 即可得到排位分 一 常模與常模分?jǐn)?shù) 27 二 常模團(tuán)體及其測(cè)量分?jǐn)?shù)的轉(zhuǎn)換 1 什么叫做常模團(tuán)體 常模團(tuán)體是具有某種共同特征的人組成的一個(gè)群體 或者是該群體的一個(gè)代表性樣本 確定常模團(tuán)體的方法是 先由測(cè)驗(yàn)將要施測(cè)的對(duì)象確定一般總體 然后根據(jù)常模擬適用的范圍確定目標(biāo)總體 再從目標(biāo)總體中抽取一代表性樣本 就形成了一個(gè)常模團(tuán)體 就一個(gè)測(cè)驗(yàn) 可以根據(jù)被試特征的不同選擇出多個(gè)不同的常模團(tuán)體 制訂出多個(gè)常模 以適用于對(duì)不同被試的測(cè)量與評(píng)估 一 常模團(tuán)體 P360 28 2 常模團(tuán)體的條件 適合于選用的常模團(tuán)體必須符合下列條件 1 所測(cè)群體的構(gòu)成必須是界定明確的 2 常模團(tuán)體必須是所測(cè)群體的代表性樣本 以保證分?jǐn)?shù)的分布特征與目標(biāo)總體一致 3 樣本大小要適當(dāng) 樣本大小的關(guān)鍵是看其是否具有代表性 總體小 只有幾十人 則需100 的樣本 總體大 樣本也要大 一般不少于30或100人 全國性常模 一般應(yīng)有2000 3000人為宜 4 具有時(shí)空的新近性 P360 29 3 常模團(tuán)體的取樣方法 取樣就是從目標(biāo)總體中抽取有代表性的樣本 其方法包括概率性抽樣和非概率性抽樣兩類 具體做法有 1 簡單隨機(jī)抽樣 2 系統(tǒng)隨機(jī)抽樣 3 分組抽樣 4 分層抽樣 5 整群隨機(jī)抽樣 P361 30 4 常模團(tuán)體的抽樣誤差 略 我們期望常模團(tuán)體能完全代表總體 即常模團(tuán)體測(cè)驗(yàn)得分的平均分及其分布狀態(tài)與所在總體完全重合 但實(shí)際上很難做到 在抽樣過程中會(huì)產(chǎn)生誤差 當(dāng)這種誤差一旦出現(xiàn) 就會(huì)成為一個(gè)常模中的系統(tǒng)誤差 所以有必要對(duì)該誤差大小進(jìn)行估計(jì) 以便能估計(jì)出使用這個(gè)常模來評(píng)定被試成績時(shí)可能產(chǎn)生的誤差范圍 統(tǒng)計(jì)學(xué)使用標(biāo)準(zhǔn)誤來估計(jì)抽樣誤差 它與被試異質(zhì)性成正比 與樣本容量的平方根成反比 即 31 試比較下列兩組數(shù)據(jù) 32 二 常模團(tuán)體分?jǐn)?shù)的轉(zhuǎn)換 常模團(tuán)體的被試均按標(biāo)準(zhǔn)程序參加測(cè)驗(yàn) 就可以得到每個(gè)被試的測(cè)驗(yàn)分?jǐn)?shù) 將這些分?jǐn)?shù)按大小順序排列 就可以得到一個(gè)分?jǐn)?shù)分布表 一系列排位等級(jí) 由此可確定各種等級(jí)位數(shù)和標(biāo)準(zhǔn)分?jǐn)?shù) 百分等級(jí) 百分點(diǎn) 百分位數(shù) 十分位數(shù) 四分位數(shù) 標(biāo)準(zhǔn)分等 有了上述排位值或標(biāo)準(zhǔn)分 就可以找到某一被試測(cè)驗(yàn)分?jǐn)?shù)的相對(duì)排位 這種排位值就是常模分?jǐn)?shù) P361 33 返回目錄 34 三 常模的類型 1 發(fā)展常模 年齡量表 1 發(fā)展順序量表 發(fā)展順序量表 就是對(duì)正常兒童樣本的心理或行為能力的發(fā)展順序進(jìn)行觀測(cè) 并制訂出各種發(fā)展水平與年齡的對(duì)照表 這種對(duì)照表就是發(fā)展順序量表 它可以提供給人們的是關(guān)于各年齡正常兒童所具有的能力或行為方式 它是最直觀的發(fā)展常模 最早的范例是葛塞爾發(fā)展順序量表 P363 35 葛塞爾發(fā)展程序表 葛塞爾發(fā)展程序表是按月份顯示兒童在運(yùn)動(dòng)水平 適應(yīng)性 語言 社會(huì)性四方面大致的發(fā)展水平 他強(qiáng)調(diào)兒童發(fā)展的規(guī)律性 順序性 具體如 4周 能控制眼睛運(yùn)動(dòng) 去追隨一個(gè)對(duì)象 16周 能使頭保持平衡 28周 能用手抓握東西 并擺玩它 40周 能控制軀干 坐立或爬行 52周 能控制腿腳運(yùn)動(dòng) 站立或行走 P363 36 皮亞杰關(guān)于兒童發(fā)展的研究 皮亞杰的研究著重于從嬰兒到十多歲兒童認(rèn)知過程的發(fā)展 尤其注重某些特殊概念的形成 其中最著名的工作就是對(duì) 守恒 概念的研究 他發(fā)現(xiàn) 兒童不同時(shí)期出現(xiàn)不同的守恒概念 5歲時(shí)出現(xiàn)質(zhì)量守恒概念 6歲時(shí)出現(xiàn)重量守恒概念 7歲時(shí)出現(xiàn)容量守恒概念 P363 37 2 智力年齡 比奈 西蒙智力測(cè)驗(yàn)最先使用了智力年齡的概念 這個(gè)量表實(shí)際上是一個(gè)智力發(fā)展的年齡量表 根據(jù)兒童所能完成的題目處在哪一年齡 就把這一年齡稱為他的智力年齡 簡稱智齡 IA 在吳天敏修訂的比奈智力量表中 每個(gè)年齡有六個(gè)題目 所以每完成一個(gè)題目相當(dāng)于智齡兩個(gè)月 這些題目的難度是呈梯級(jí)增加的 這樣可以根據(jù)被試完成的題數(shù)確定其智齡 P363 38 3 年級(jí)當(dāng)量 年級(jí)當(dāng)量就是年級(jí)量表 測(cè)驗(yàn)結(jié)果說明被試的能力或?qū)W績達(dá)到了哪一年級(jí)的水平 年級(jí)量表的單位通常為10個(gè)月 4 5的年級(jí)當(dāng)量代表的是第4年級(jí)中的第5個(gè)月水平或說中間水平 而不是指4 5年級(jí)的平均水平 7 3代表的是7年級(jí)中的第3個(gè)月水平 P364 39 2 百分位常模 百分位常模包括百分等級(jí)和百分點(diǎn) 四分位數(shù) 十分位數(shù) 未分組資料的百分等級(jí) 百分點(diǎn) 也叫百分位數(shù) 計(jì)算 P364 40 3 標(biāo)準(zhǔn)分常模 標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表 常見的標(biāo)準(zhǔn)分?jǐn)?shù)有 z分?jǐn)?shù) Z分?jǐn)?shù) T分?jǐn)?shù) 標(biāo)準(zhǔn)九分?jǐn)?shù) 離差智商 IQ 等 在線性轉(zhuǎn)換中 加上一個(gè)常數(shù)是為消除負(fù)數(shù) 乘上一個(gè)常數(shù)是為了去掉小數(shù)點(diǎn) 如將原始分?jǐn)?shù)轉(zhuǎn)換為平均數(shù)為50 標(biāo)準(zhǔn)差為10的標(biāo)準(zhǔn)分 則叫做T分?jǐn)?shù) T 50 10z 最早提出者是麥柯爾 P365 41 非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù) 了解 標(biāo)準(zhǔn)九分是一9級(jí)的分?jǐn)?shù)量表 它是以5為平均數(shù) 以2為標(biāo)準(zhǔn)差的一個(gè)分?jǐn)?shù)量表 標(biāo)準(zhǔn)十分是一10級(jí)的分?jǐn)?shù)量表 其以5為平均數(shù) 以1 5為標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)二十分是一20級(jí)的分?jǐn)?shù)量表 其以10為平均數(shù) 以3為標(biāo)準(zhǔn)差 P365 42 4 智商及其意義 1 比率智商 但是 用比率智商反映個(gè)體的智力發(fā)展 概念有缺陷 首先心理年齡 MentalAge 簡稱MA 與實(shí)足年齡 ChronologicalAge 簡稱CA 并不同步增長 所以比率智商不適合于年齡較大的被試 其次 不同年齡組兒童的比率智商分布的情況不一樣 所以相同的比率智商在不同年齡就具有不同意義 P366 43 2 離差智商 離差智商是一種以年齡組為樣本計(jì)算而得標(biāo)準(zhǔn)分?jǐn)?shù) 并且轉(zhuǎn)換成平均數(shù)為100 標(biāo)準(zhǔn)差為15的標(biāo)準(zhǔn)分?jǐn)?shù) 其中 X為一被試的測(cè)驗(yàn)分?jǐn)?shù) M為相應(yīng)年齡組常模樣本測(cè)驗(yàn)的平均分 SD為相應(yīng)年齡組常模樣本測(cè)驗(yàn)的標(biāo)準(zhǔn)差 P366 44 四 常模分?jǐn)?shù)的表示方法 1 轉(zhuǎn)換表法 轉(zhuǎn)換表也叫常模表 一個(gè)轉(zhuǎn)換表顯示出一個(gè)特定的標(biāo)準(zhǔn)化樣組的原始分?jǐn)?shù)與其相應(yīng)的等值分?jǐn)?shù) 百分位 標(biāo)準(zhǔn)分?jǐn)?shù) T分?jǐn)?shù)或者其他任何分?jǐn)?shù) 利用轉(zhuǎn)換表可以將被試的測(cè)驗(yàn)分?jǐn)?shù)轉(zhuǎn)換為與其對(duì)應(yīng)的導(dǎo)出分?jǐn)?shù) P368 45 2 剖面圖法 剖面圖是將測(cè)驗(yàn)分?jǐn)?shù)的轉(zhuǎn)換關(guān)系用圖形表示出來 從剖面圖上可以很直觀地看出被試在各個(gè)分測(cè)驗(yàn)上的表現(xiàn)及其相應(yīng)的位置 46 47 1 常模團(tuán)體必須是所測(cè)群體的 A 總體B 優(yōu)秀分子C 隨機(jī)樣本D 代表性樣本2 全國性常模 一般常模團(tuán)體應(yīng)有 人為宜 A 30 100B 100 500C 2000 3000D 5000以上3 最早的發(fā)展順序量表是 制訂的 A 比內(nèi)B 皮亞杰C 葛塞爾D 科爾伯格4 皮亞杰特別關(guān)注一些特殊概念形成的研究 如 概念的研究 A 數(shù)量B 守恒C 順應(yīng)D 同化5 百分位常模包括 A 百分等級(jí)B 百分點(diǎn)C 四分位數(shù)D 十分位數(shù) 本節(jié)學(xué)習(xí)檢測(cè)題 48 6 小明語文分?jǐn)?shù)在全班50名同學(xué)中排15名 則其百分等級(jí)為 A 15 B 30 C 71 D 85 7 常見的標(biāo)準(zhǔn)分常模有 A T分?jǐn)?shù)B 百分位數(shù)C 離差智商D 標(biāo)準(zhǔn)九分?jǐn)?shù)8 標(biāo)準(zhǔn)T分?jǐn)?shù)的平均數(shù)為50 標(biāo)準(zhǔn)差為 A 5B 10C 15D 不確定9 標(biāo)準(zhǔn)九分的平均數(shù)和標(biāo)準(zhǔn)差分別為 A 5 1B 6 1C 5 2D 6 210 標(biāo)準(zhǔn)十分的平均數(shù)和標(biāo)準(zhǔn)差分別為 A 5 1B 6 1C 5 1 5D 6 1 511 使用最廣 影響最大的常態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)是 A T分?jǐn)?shù)B 比率智商C Z分?jǐn)?shù)D 離差智商 49 12 16PF的量表分是 A 標(biāo)準(zhǔn)九分B 標(biāo)準(zhǔn)十分C T分?jǐn)?shù)D Z分?jǐn)?shù)13 比率智商是指 A 實(shí)足年齡與心理年齡之比B 心理年齡與實(shí)足年齡之比C 心理年齡與實(shí)足年齡之差D 實(shí)足年齡與心理年齡之差14 在斯坦福 比內(nèi)量表的發(fā)展中 其主要特征是 A 測(cè)驗(yàn)成績用智齡表示B 首次引用智商概念C 用離差智商代替比率智商D 用L型和M型兩個(gè)等值量表15 下面哪一個(gè)是離差智商 A IQ MA CA 100B IQ MA CA 100 C IQ 100 15 X X SDD IQ 50 15 X M SD16 最簡單和最基本的常模表示方法是 A 比率智商B 離差智商C 轉(zhuǎn)換表D 剖面圖 50 第三節(jié)測(cè)驗(yàn)的信度分析 信度是指同一被試者在不同時(shí)間內(nèi)用同一測(cè)驗(yàn) 或用另一套相等的測(cè)驗(yàn) 重復(fù)測(cè)量 所得結(jié)果的一致性程度 前后測(cè)驗(yàn)分?jǐn)?shù)一致性程度高 即可信度高 反之可信度低 一 信度的定義 P371 51 信度的本質(zhì) 一般來說 使用一個(gè)工具對(duì)個(gè)體進(jìn)行測(cè)量時(shí) 所得結(jié)果由兩部分組成 X T E 其中 T是真分?jǐn)?shù) 它是穩(wěn)定的值 E是隨機(jī)誤差 它的變化是隨機(jī)的 如重復(fù)進(jìn)行測(cè)量 隨機(jī)誤差會(huì)造成分?jǐn)?shù)起伏變化 隨機(jī)誤差小 實(shí)測(cè)分?jǐn)?shù)起伏小 信度較高 相反 隨機(jī)誤差大 實(shí)測(cè)分?jǐn)?shù)起伏大 數(shù)據(jù)不穩(wěn)定 信度較低 所以 信度受隨機(jī)誤差而不是系統(tǒng)誤差影響 理論上講 要評(píng)估工具的信度 就要對(duì)一個(gè)人反復(fù)進(jìn)行測(cè)量 看前后結(jié)果的穩(wěn)定性 但是 這在很多時(shí)候是行不通的 52 通常的做法是 選取一個(gè)被試團(tuán)體即樣本 使用一個(gè)工具對(duì)樣本團(tuán)體中的每一個(gè)體進(jìn)行測(cè)量 得到一組數(shù)據(jù) 這一組數(shù)據(jù)的總變異方差Sx2 ST2 SE2 如果測(cè)量中沒有隨機(jī)誤差 則實(shí)測(cè)數(shù)據(jù)總方差就等于真分?jǐn)?shù)方差 數(shù)據(jù)完全可信 如果隨機(jī)誤差很大 真分?jǐn)?shù)方差只占總方差中很小一部分 數(shù)據(jù)幾乎全無可信 如果隨機(jī)誤差較小 真分?jǐn)?shù)占總方差的大部分 則信度較高 于是信度被定義為 一組測(cè)量分?jǐn)?shù)中真分?jǐn)?shù)的方差與測(cè)驗(yàn)分?jǐn)?shù)的總方差之比 該比率也叫信度系數(shù) 由公式看出 隨機(jī)誤差引起的方差越小 信度系數(shù)越接近于1 53 54 二 信度的指標(biāo) 信度的定義是明確的 但是在一組測(cè)量分?jǐn)?shù)中 真分?jǐn)?shù)方差是未知的 所以真分?jǐn)?shù)方差與誤差方差無法分離 信度系數(shù)計(jì)算仍然是一句空話 不過 可以設(shè)想 讓一個(gè)被試團(tuán)體接受同一種工具的兩次測(cè)量 因?yàn)閷?shí)測(cè)分?jǐn)?shù)由真分?jǐn)?shù)和隨機(jī)誤差組成 隨機(jī)誤差較小時(shí)實(shí)測(cè)分?jǐn)?shù)主要由真分?jǐn)?shù)組成而真分?jǐn)?shù)在前后兩次測(cè)量中是穩(wěn)定的 所以前后兩次實(shí)測(cè)分?jǐn)?shù)一致性就高 具有較高的正相關(guān) 反之 就具有低相關(guān)甚至負(fù)相關(guān) 所以 兩次測(cè)量結(jié)果的相關(guān)可以間接反映測(cè)量隨機(jī)誤差大小 信度系數(shù)就是一種相關(guān)系數(shù) 信度系數(shù)成為可計(jì)算的指標(biāo)了 1 信度系數(shù)與信度指數(shù) P371 55 信度指數(shù)等于真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)測(cè)分?jǐn)?shù)標(biāo)準(zhǔn)差的比值 所以信度系數(shù)正好等于信度指數(shù)的平方 信度指數(shù) P371 56 何謂相關(guān)呢 相關(guān)系數(shù)的意義是什么 57 2 測(cè)量的標(biāo)準(zhǔn)誤 隨機(jī)誤差的標(biāo)準(zhǔn)差也就是標(biāo)準(zhǔn)誤 對(duì)于一個(gè)樣本的測(cè)量來說 分?jǐn)?shù)的標(biāo)準(zhǔn)差一部分是反映個(gè)體真值的差異性 一部分是反映隨機(jī)誤差的起伏變化性即誤差的標(biāo)準(zhǔn)差 根據(jù)前面的信度公式可以推導(dǎo)出 SE越大 rxx就越小 反之 rxx就越大 所以標(biāo)準(zhǔn)誤也是一種信度指標(biāo) P371 58 三 信度評(píng)估的方法 1 重測(cè)信度 test retestreliabllity 又稱穩(wěn)定性系數(shù) 使用同一測(cè)驗(yàn) 在其他條件相同的情況下對(duì)同一組被試者前后施測(cè)兩次測(cè)驗(yàn) 求兩次得分間的相關(guān)系數(shù) 一般是2 4周較宜 間隔時(shí)間最好不超過6個(gè)月 P372 59 2 復(fù)本信度 alternate formreliability 以兩個(gè)等值但題目不同的測(cè)驗(yàn) 復(fù)本 來測(cè)量同一群體 然后求得被試者在兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)復(fù)本信度反映的是測(cè)驗(yàn)在內(nèi)容上的等值性 故又稱等值性系數(shù) 某種意義上 它更像效度 P372 60 3 內(nèi)部一致性信度 1 分半信度 split halfreliability 這個(gè)相關(guān)系數(shù)就代表了兩半測(cè)驗(yàn)內(nèi)容取樣的一致程度 式中為rhh為一半分?jǐn)?shù)的相關(guān)系數(shù) rXX為測(cè)驗(yàn)在原長度時(shí)的信度估計(jì)值 P373 61 2 同質(zhì)性信度 homogeneityreliability 代表測(cè)驗(yàn)內(nèi)部所有題目間的一致性 如果各項(xiàng)目測(cè)量同一心理特質(zhì) 則項(xiàng)目間得分應(yīng)有顯著的正相關(guān) 這時(shí)內(nèi)部一致性較高 信度較高 如果項(xiàng)目間出現(xiàn)低相關(guān)或負(fù)相關(guān) 則內(nèi)部一致性差 信度不高 當(dāng)測(cè)驗(yàn)包含多個(gè)分測(cè)驗(yàn)時(shí) 則應(yīng)首先計(jì)算各分測(cè)驗(yàn)的同質(zhì)性信度 再計(jì)算全量表的同質(zhì)性信度 對(duì)二項(xiàng)記分測(cè)驗(yàn) 使用庫德 理查遜公式計(jì)算同質(zhì)信度 對(duì)于多等級(jí)記分的測(cè)驗(yàn) 計(jì)算克倫巴赫 系數(shù)來估算信度大小 對(duì)于項(xiàng)目編排時(shí) 專門進(jìn)行反向記分處理的項(xiàng)目 要在計(jì)算同質(zhì)性信度之前對(duì)記分進(jìn)行反向調(diào)整 P373 62 4 評(píng)分者信度 隨機(jī)抽取若干份測(cè)卷 由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分 然后根據(jù)每份測(cè)驗(yàn)卷的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān) 即得評(píng)分者信度 一般要求在成對(duì)的受過訓(xùn)練的評(píng)分者之間評(píng)分一致性要達(dá)到0 90以上 才認(rèn)為評(píng)分是可信的 當(dāng)評(píng)分者人數(shù)達(dá)到三人以上時(shí) 通過計(jì)算肯德爾和諧系數(shù)來估價(jià)評(píng)分者信度 P373 63 四 信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋 1 解釋實(shí)測(cè)得分與真分?jǐn)?shù)的相關(guān) 信度系數(shù)反映了實(shí)測(cè)分?jǐn)?shù)變化與真分?jǐn)?shù)變化的一致性程度 當(dāng)rxx 1 00時(shí) 二者完全一致 實(shí)測(cè)數(shù)據(jù)的變異量 方差 全部是由于真分?jǐn)?shù)不同引起的 當(dāng)rxx 0 00時(shí) 則說明實(shí)測(cè)分?jǐn)?shù)的變異量全部是由隨機(jī)誤差起伏變化引起的 實(shí)測(cè)數(shù)據(jù)變化沒能反映真分?jǐn)?shù)不同的任何信息 當(dāng)rxx 0 90 說明實(shí)測(cè)數(shù)據(jù)變化的90 都是由真分?jǐn)?shù)不同引起的 實(shí)測(cè)分?jǐn)?shù)反映了真分?jǐn)?shù)大部分的變化信息 具有高的可信度 所以 信度系數(shù)也反映了測(cè)量的隨機(jī)誤差比例 P373 64 在根據(jù)信度水平?jīng)Q定是否采用某一測(cè)驗(yàn)時(shí) 需要重點(diǎn)考慮測(cè)驗(yàn)的目標(biāo)和功用 一般能力測(cè)驗(yàn)和成就測(cè)驗(yàn) 信度應(yīng)在0 90以上 人格 態(tài)度 興趣 價(jià)值觀等測(cè)驗(yàn) 信度應(yīng)在0 80以上 另需注意 1 信度系數(shù)低于0 70時(shí) 測(cè)驗(yàn)不能用于對(duì)人的評(píng)價(jià)和預(yù)測(cè) 也不能用于作團(tuán)體間的比較 達(dá)到0 70以上 可用于作團(tuán)體比較 達(dá)到0 85以上 測(cè)驗(yàn)可用于對(duì)個(gè)人的評(píng)價(jià)和預(yù)測(cè) 2 新編測(cè)驗(yàn)的信度應(yīng)高于同類測(cè)驗(yàn)或相似測(cè)驗(yàn) 2 確定測(cè)驗(yàn)的可接受程度 P374 65 3 解釋個(gè)人分?jǐn)?shù)的意義 兩個(gè)作用 其一 是估計(jì)真實(shí)分?jǐn)?shù)的范圍 其二 是了解實(shí)得分?jǐn)?shù)再測(cè)時(shí)可能的變化情形 P374 66 五 信度的影響因素 信度常用信度系數(shù)來表示 信度系數(shù)就是相關(guān)系數(shù) 相關(guān)系數(shù)的獲得需要一個(gè)被試樣本 或叫樣本團(tuán)體 1 樣本團(tuán)體異質(zhì)性的影響 當(dāng)樣本異質(zhì)性高時(shí) 計(jì)算的信度系數(shù)會(huì)較大 可能會(huì)高估測(cè)驗(yàn)的信度 反之 計(jì)算的信度系數(shù)較小 可能會(huì)低估測(cè)驗(yàn)信度 2 樣本團(tuán)體平均能力水平的影響 樣本平均能力水平的高低也會(huì)影響分?jǐn)?shù)的分布 所以也會(huì)影響信度計(jì)算 一般要求 在給出信度系數(shù)時(shí) 也要描述相應(yīng)的測(cè)量樣本 1 被試樣本特征 P375 67 2 測(cè)驗(yàn)的長度 測(cè)驗(yàn)的長度 即測(cè)驗(yàn)的項(xiàng)目數(shù)會(huì)影響測(cè)驗(yàn)的信度 1 測(cè)驗(yàn)越長 測(cè)驗(yàn)的測(cè)題取樣或內(nèi)容取樣越具有代表性 2 測(cè)驗(yàn)越長 被試的猜測(cè)因素對(duì)結(jié)果的影響就越小 但是 增加測(cè)驗(yàn)長度的效果是遵循報(bào)酬遞減率原則的 這里可以利用斯皮爾曼 布朗公式的導(dǎo)出公式了解測(cè)驗(yàn)長度與信度系數(shù)的關(guān)系 要使測(cè)驗(yàn)的信度從原來的rxx提高到rkk 則測(cè)驗(yàn)的長度需要增加到原來的K倍 P376 68 3 測(cè)驗(yàn)的難度 對(duì)于能力與成就測(cè)驗(yàn)來說 存在難度問題 一般來說 中等難度的測(cè)驗(yàn) 計(jì)算出來的信度系數(shù)較大 太難和太容易都會(huì)使信度較低 對(duì)于簡答題 難度為0 50 求得的信度較高 對(duì)于選擇題 因有猜測(cè)成分 所以難度應(yīng)適當(dāng)提高 P376 69 4 時(shí)間間隔 對(duì)于重測(cè)信度和不同時(shí)測(cè)量的復(fù)本信度來說 存在時(shí)間間隔問題 時(shí)間間隔越短 計(jì)算得到的信度系數(shù)越大 時(shí)間間隔越長 信度系數(shù)越低 一般是2 4周較宜 間隔時(shí)間最好不超過6個(gè)月 P376 70 1 衡量測(cè)量結(jié)果一致性程度的指標(biāo)是 A 區(qū)分度B 難度C 信度D 效度2 下列可作為信度指標(biāo)的是 A 信度系數(shù)B 信度指數(shù)C 標(biāo)準(zhǔn)差D 標(biāo)準(zhǔn)誤3 重測(cè)信度反映的是測(cè)驗(yàn)在 上的穩(wěn)定性 A 內(nèi)容B 時(shí)間C 空間D 誤差4 復(fù)本信度反映的是兩個(gè)測(cè)驗(yàn)在 上的一致性 A 內(nèi)容B 時(shí)間C 空間D 誤差5 重測(cè)信度的計(jì)算中 重測(cè)的時(shí)距一般最多不要超過 A 2周B 4周C 4月D 6月 本節(jié)學(xué)習(xí)檢測(cè)題 71 6 內(nèi)部一致性信度主要包括 兩種 A 分半信度和重測(cè)信度B 重測(cè)信度和復(fù)本信度C 復(fù)本信度和同質(zhì)性信度D 分半信度和同質(zhì)性信度7 二級(jí)評(píng)分測(cè)驗(yàn)同質(zhì)信度可用以下 方法計(jì)算 A 分半信度B 庫德 理查遜公式法C 系數(shù)法D 重測(cè)信度法8 計(jì)算的分半信度為0 80 那么整個(gè)測(cè)驗(yàn)的信度大約為 A 0 80B 0 85C 0 89D 0 959 用庫德 理查遜公式計(jì)算信度的方法適用于 A 多等級(jí)選擇測(cè)驗(yàn)B 判斷題測(cè)驗(yàn)C 多項(xiàng)選擇和判斷題測(cè)驗(yàn)D 簡答題10 克倫巴赫 系數(shù)法適合于 測(cè)驗(yàn)的信度計(jì)算 A 多等級(jí)選擇測(cè)驗(yàn)B 判斷題測(cè)驗(yàn)C 多項(xiàng)選擇題測(cè)驗(yàn)D 簡答題 72 11 評(píng)估評(píng)分者之間一致性的信度是 A 復(fù)本信度B 肯德爾和諧系數(shù)C 同質(zhì)信度D 分半信度12 一個(gè)測(cè)驗(yàn)選用哪種方法計(jì)算信度 主要是看 A 哪種因素導(dǎo)致更大的誤差B 哪種因素導(dǎo)致的誤差最小C 哪種方法更簡單D 對(duì)哪種方法更熟練13 要取得較高的同質(zhì)信度 測(cè)驗(yàn)內(nèi)部項(xiàng)目間得分要有 A 較高正相關(guān)B 較高負(fù)相關(guān)C 較低正相關(guān)D 較低負(fù)相關(guān)14 當(dāng)一個(gè)測(cè)驗(yàn)的信度系數(shù)為0 85時(shí) 就可以說 A 真分?jǐn)?shù)變異占總變異的85 B 真分?jǐn)?shù)變異占總變異的15 C 隨機(jī)誤差變異占總變異的85 D 隨機(jī)誤差變異占總變異的15 15 一般的能力測(cè)驗(yàn)和成就測(cè)驗(yàn)的信度系數(shù)應(yīng)達(dá)到 以上 A 0 70B 0 80C 0 90D 0 95 73 16 影響信度的因素包括 A 樣本特征B 測(cè)驗(yàn)長度C 測(cè)驗(yàn)難度D 時(shí)間間隔17 樣本團(tuán)體同質(zhì)性高 則計(jì)算的信度系數(shù) A 會(huì)低估測(cè)驗(yàn)的信度B 會(huì)高估測(cè)驗(yàn)的信度C 會(huì)偏低D 會(huì)偏高18 當(dāng)希望以增加測(cè)驗(yàn)長度的方法使其一50題組成的測(cè)驗(yàn)的信度系數(shù)從0 85提高到0 90 那么測(cè)驗(yàn)長度要增加 題 A 30B 60C 80D 9019 受時(shí)間間隔影響的信度計(jì)算是 A 重測(cè)信度B 分半信度C 同質(zhì)信度D 克倫巴赫 系數(shù) 74 第四節(jié)測(cè)驗(yàn)的效度 一 效度的概念 1 什么叫做效度 在心理測(cè)驗(yàn)中 效度是指一個(gè)測(cè)驗(yàn)所能測(cè)量到它想要測(cè)量的心理特質(zhì)或傾向的程度 也就是它對(duì)測(cè)量目標(biāo)測(cè)量的準(zhǔn)確性 測(cè)量分?jǐn)?shù)可分解為真分?jǐn)?shù)和隨機(jī)誤差 真分?jǐn)?shù)可以再分解為兩部分 反映測(cè)量目標(biāo)水平的分?jǐn)?shù)和系統(tǒng)誤差 即與測(cè)量目標(biāo)有關(guān)的部分和與測(cè)量目標(biāo)無關(guān)的部分 效度是 在一組測(cè)量分?jǐn)?shù)中 與測(cè)量目標(biāo)有關(guān)部分的方差S2V與總方差S2X之比 P379 75 2 效度的性質(zhì) 1 效度具有相對(duì)性任何測(cè)驗(yàn)都是針對(duì)一定目標(biāo)編制的 用于該目標(biāo)就會(huì)有效 用于其他目標(biāo)就可能無效 對(duì)某一總體有效的測(cè)驗(yàn) 對(duì)于其他總體未必有效 某一心理學(xué)家認(rèn)為有效的測(cè)驗(yàn) 其他心理學(xué)家可能認(rèn)為無效 2 效度具有連續(xù)性說明 一 測(cè)驗(yàn)效度也是用相關(guān)系數(shù)表示 有高低之分 非 有 和 無 之差 二是 效度是針對(duì)測(cè)量結(jié)果來說的 P379 76 3 效度與信度的關(guān)系 1 信度是效度的必要條件 但不是充分條件 2 效度總會(huì)受到信度的制約 它不會(huì)超過信度的平方根 P380 77 二 效度評(píng)估的方法 美國心理學(xué)會(huì)在1974年所發(fā)行的 教育與心理測(cè)量之標(biāo)準(zhǔn) 一書中將效度分為三大類 內(nèi)容效度 構(gòu)想效度 效標(biāo)效度 1 內(nèi)容效度 content relatedvalidity 內(nèi)容效度是指測(cè)驗(yàn)項(xiàng)目在內(nèi)容上的適合性 即是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣 要編制有高內(nèi)容效度的測(cè)驗(yàn) 就要對(duì)測(cè)量的心理特性有明確的定義 并劃定出相應(yīng)的行為內(nèi)容 其次 測(cè)驗(yàn)題目應(yīng)是所界定的行為內(nèi)容的代表性取樣 P380 78 內(nèi)容效度的專家評(píng)定法 專家評(píng)定是最常用的內(nèi)容效度評(píng)估方法 是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與測(cè)量目標(biāo)的符合性程度作出評(píng)判 看測(cè)驗(yàn)的題目是否代表欲測(cè)的內(nèi)容 也可以請(qǐng)專家對(duì)測(cè)驗(yàn)項(xiàng)目的適合性進(jìn)行定量評(píng)定 專家的判斷多是依賴于對(duì)內(nèi)容的邏輯分析 所以這種評(píng)估的效度也叫做邏輯效度 P381 79 關(guān)于內(nèi)容效度要注意的兩個(gè)問題 第二 內(nèi)容效度與表面效度的區(qū)分 最高作為測(cè)驗(yàn)可以有比較高的表面效度 典型行為測(cè)驗(yàn)則要有比較低的表面效度 但兩類測(cè)驗(yàn)都要有高的內(nèi)容效度 第一 測(cè)驗(yàn)要有高的內(nèi)容效度 但不一定要有高的同質(zhì)性 P381 80 2 構(gòu)想效度 1 什么叫做構(gòu)想效度 構(gòu)想效度 就是一個(gè)測(cè)驗(yàn)對(duì)于某一理論構(gòu)想或內(nèi)在心理特質(zhì)假設(shè)的證實(shí)程度 測(cè)量程度 所以也叫做構(gòu)思效度 結(jié)構(gòu)效度等 建立構(gòu)想效度的邏輯順序 基于相關(guān)專業(yè)知識(shí)和觀測(cè)資料 提出某一心理特質(zhì)假設(shè)或某一心理結(jié)構(gòu)理論假設(shè) 然后根據(jù)理論或假設(shè)所可能對(duì)應(yīng)的行為特點(diǎn)編制測(cè)驗(yàn)并進(jìn)行施測(cè) 最后對(duì)測(cè)量結(jié)果進(jìn)行相關(guān)或因素分析 驗(yàn)證其與理論假設(shè)的符合程度 P382 81 2 構(gòu)想效度的評(píng)估方法 從測(cè)驗(yàn)的組成成分來分析其結(jié)構(gòu)是否與理論構(gòu)思一致 常用因素分析方法來確定測(cè)驗(yàn)的結(jié)構(gòu)成分 當(dāng)使用一個(gè)新編制的測(cè)驗(yàn)對(duì)目標(biāo)群體施測(cè)后 對(duì)測(cè)驗(yàn)項(xiàng)目進(jìn)行因素分析 還可以通過計(jì)算相容相關(guān)和區(qū)分相關(guān)來間接驗(yàn)證所編測(cè)驗(yàn)?zāi)軌驕y(cè)量的是不是某一種心理特質(zhì)或理論構(gòu)想 P382 82 3 效標(biāo)效度 1 什么叫效標(biāo)效度 效標(biāo)效度是指使用測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的準(zhǔn)確性 被預(yù)測(cè)的行為同時(shí)也就成為檢驗(yàn)測(cè)驗(yàn)有效性的效標(biāo) 這種效度也叫實(shí)證效度 根據(jù)效標(biāo)資料與測(cè)驗(yàn)分?jǐn)?shù)獲得的時(shí)間不同 效標(biāo)效度又分為同時(shí)效度和預(yù)測(cè)效度 二者差異主要在于測(cè)驗(yàn)的目的不同 同時(shí)效度與用來診斷現(xiàn)狀的測(cè)驗(yàn)有關(guān) 后者與預(yù)測(cè)將來結(jié)果的測(cè)驗(yàn)有關(guān) P383 83 2 效標(biāo)效度的評(píng)估方法 相關(guān)法 區(qū)分法 命中率法 P384 84 4 效度系數(shù)的計(jì)算方法 效標(biāo)效度的計(jì)算 第一步取得測(cè)驗(yàn)分?jǐn)?shù)x和效標(biāo)分?jǐn)?shù)y 好的效標(biāo)需要具備下列條件 有效的反映測(cè)驗(yàn)的目標(biāo) 具有較高的信度 穩(wěn)定可靠 可以客觀地加以測(cè)量 可用數(shù)據(jù)或等級(jí)來表示 測(cè)量的方法要簡單 省時(shí)省力 經(jīng)濟(jì)可用 85 當(dāng)測(cè)驗(yàn)分?jǐn)?shù) 效標(biāo)資料均為連續(xù)數(shù)據(jù)時(shí) 使用積差相關(guān) 當(dāng)測(cè)驗(yàn)分?jǐn)?shù) 效標(biāo)資料均為等級(jí)變量時(shí) 使用等級(jí)相關(guān) 第二步根據(jù)兩種分?jǐn)?shù)的性質(zhì)選用適當(dāng)方法計(jì)算相關(guān)系數(shù) 86 三 效度系數(shù)的作用 預(yù)測(cè)效標(biāo) 效度系數(shù)的實(shí)際意義常以決定系數(shù)表示 即效度的內(nèi)涵 為相關(guān)系數(shù)的平方 它表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)方差占總方差的比例 如測(cè)驗(yàn)的效度是0 80 則測(cè)驗(yàn)分?jǐn)?shù)能正確預(yù)測(cè)效標(biāo)分?jǐn)?shù)變異量的64 效度系數(shù)是根據(jù)測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)計(jì)算出來的相關(guān)系數(shù) 所以它也反映了二者所具有的共變關(guān)系 這樣就可以建立二者的回歸方程式 以便由測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)分?jǐn)?shù) P385 87 如果用一被試的測(cè)驗(yàn)分?jǐn)?shù)來估計(jì)他的效標(biāo)分?jǐn)?shù) 誤差會(huì)有多大呢 這用標(biāo)準(zhǔn)誤來估計(jì) 從公式看 效度系數(shù)的大小與估計(jì)的誤差有關(guān) 如果效度系數(shù)rxy 1 00 則估計(jì)誤差等于0 通過測(cè)驗(yàn)分?jǐn)?shù)可準(zhǔn)確預(yù)測(cè)效標(biāo)分?jǐn)?shù)變化 如果rxy 0 00 則以測(cè)驗(yàn)分?jǐn)?shù)無法估計(jì)效標(biāo)分?jǐn)?shù) 以測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)則無異于猜測(cè) P385 88 預(yù)測(cè)效率指數(shù) 據(jù)預(yù)測(cè)效標(biāo)分?jǐn)?shù)的標(biāo)準(zhǔn)誤計(jì)算公式 無關(guān)系數(shù)K的計(jì)算公式 K反映了測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的無關(guān)程度 它受效度系數(shù)的影響 當(dāng)效度系數(shù)等于1時(shí) K 0 測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)有完全的對(duì)應(yīng)關(guān)系 當(dāng)效度系數(shù)等于0 K 1 測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)100 的無關(guān) 測(cè)驗(yàn)與效標(biāo)分?jǐn)?shù)完全無關(guān) 它對(duì)效標(biāo)分?jǐn)?shù)沒有任何預(yù)測(cè)力 當(dāng)效度系數(shù)等于0 90時(shí) 可以計(jì)算出K 0 436 即測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)的無關(guān)程度是43 6 預(yù)測(cè)效率指數(shù)就是56 4 即使用該測(cè)驗(yàn)預(yù)測(cè)被試的效標(biāo)分?jǐn)?shù) 較之瞎猜 可以減少56 4 的誤差 P386 89 四 效度的影響因素 根據(jù)前文關(guān)于信度和效度概念的分析 知道 隨機(jī)誤差影響信度 進(jìn)而影響效度 系統(tǒng)誤差直接影響效度本身 所以 凡是會(huì)產(chǎn)生隨機(jī)誤差和系統(tǒng)誤差的因素都會(huì)影響測(cè)驗(yàn)的效度 P386 90 1 測(cè)驗(yàn)編制本身的因素 測(cè)驗(yàn)取材的代表性 長度 試題類型 難度 區(qū)分度以及編排方式等都會(huì)影響效度 為此 編制要注意 1 測(cè)驗(yàn)材料要有應(yīng)測(cè)內(nèi)容具有代表性 2 盡量避免誤差較大的題型 如是非題 3 難度要適中 具有較大的區(qū)分度 4 測(cè)驗(yàn)長度要恰當(dāng) 保證一定的題量 5 測(cè)題的排列應(yīng)先易后難 P386 91 2 測(cè)驗(yàn)施測(cè)過程中的干擾因素 1 測(cè)驗(yàn)實(shí)施中主試的影響 如是否按標(biāo)準(zhǔn)化來實(shí)施 測(cè)驗(yàn)與效標(biāo)測(cè)量的實(shí)施的時(shí)間間隔 測(cè)驗(yàn)環(huán)境的布置等 2 測(cè)驗(yàn)實(shí)施中被試的影響 如被試參加測(cè)驗(yàn)的動(dòng)機(jī) 情緒 態(tài)度 身體狀態(tài) 反應(yīng)定勢(shì)等 P386 92 3 所抽取的樣本團(tuán)體的特點(diǎn) 1 樣本團(tuán)體的異質(zhì)性 其他條件相同 樣本團(tuán)體同質(zhì)性越高 分?jǐn)?shù)范圍越小 得到的效度系數(shù)就會(huì)越低 會(huì)低估測(cè)驗(yàn)效度 反之 得到的效度系數(shù)就越大 可能會(huì)高估效度 比如 只使用經(jīng)選拔后的被試組成樣本團(tuán)體 增加了被試同質(zhì)性 測(cè)驗(yàn)得到的效度系數(shù)會(huì)較低 2 干涉因素 樣本團(tuán)體的有些變量會(huì)影響效度測(cè)驗(yàn) 比如被試的年齡 性別 受教育程度 智力 動(dòng)機(jī) 興趣 職業(yè)等特征 對(duì)于同一個(gè)測(cè)驗(yàn)來說 使用的樣本團(tuán)體不同 得到的效度系數(shù)也會(huì)不同 P387 93 4 效標(biāo)的性質(zhì) 1 效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)是否是線性關(guān)系 2 效標(biāo)測(cè)驗(yàn)本身的可靠性 即信度 P388 94 1 效度是指測(cè)驗(yàn)的準(zhǔn)確性 即 A 真分?jǐn)?shù)方差與總方差之比B 隨機(jī)誤差方差與總方差之比C 與測(cè)量目標(biāo)有關(guān)的真實(shí)方差與總方差之比D 真分?jǐn)?shù)方差與系統(tǒng)誤差方差之比2 反映測(cè)驗(yàn)題目是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣 屬于 A 內(nèi)容效度B 構(gòu)想效度C 效標(biāo)效度D 表面效度3 使用專家判斷法評(píng)估的效度也叫 A 效標(biāo)效度B 表面效度C 邏輯效度D 構(gòu)想效度4 在下列測(cè)驗(yàn)中 最需要降低表面效度的測(cè)驗(yàn)是 A 智力測(cè)驗(yàn)B 氣質(zhì)測(cè)驗(yàn)C 性格測(cè)驗(yàn)D 學(xué)績測(cè)驗(yàn) 本節(jié)學(xué)習(xí)檢測(cè)題 95 5 當(dāng)效度系數(shù)等于1時(shí) 被試的測(cè)驗(yàn)分?jǐn)?shù) A 可以準(zhǔn)確預(yù)測(cè)其效標(biāo)分?jǐn)?shù)B 對(duì)效標(biāo)分?jǐn)?shù)沒有任何的預(yù)測(cè)力C 就是效標(biāo)分?jǐn)?shù)D 與效標(biāo)分?jǐn)?shù)有最大的正相關(guān)6 影響效度的因素包括 A 測(cè)驗(yàn)本身B 主試因素C 被試因素D 效標(biāo)的性質(zhì)7 用下列樣本評(píng)估中學(xué)生智力測(cè)驗(yàn)效度 得到較大效度系數(shù)的是 A 全省中學(xué)生的代表性樣本B 全省重點(diǎn)高中學(xué)生的代表性樣本C 全省青少年的代表性樣本D 全省當(dāng)年高考一本上線代表性樣本 96 第五節(jié)項(xiàng)目分析 一 項(xiàng)目的難度 1 難度的定義 測(cè)驗(yàn)項(xiàng)目的難易程度 通常以題目的通過率為指標(biāo) 2 難度的計(jì)算方法 1 二分法計(jì)分項(xiàng)目最簡單方法就是以被試在該項(xiàng)目上的通過率評(píng)估難度 當(dāng)被試人數(shù)多時(shí) 可以高分組和低分組通過率的平均數(shù)來評(píng)估 P PH PL 2 P389 P R N 100 97 在有多選項(xiàng)的選擇題中 為了平衡機(jī)遇因素的影響 可采用吉爾福特的難度校正公式來計(jì)算難度 Cp為校正后的通過率 P為實(shí)際得到的通過率 K為被選答案數(shù) 98 2 非二分計(jì)分的項(xiàng)目 即以被試在某一項(xiàng)目上得分的平均值除以該題滿分 再乘以100 P390 99 3 難度水平的確定 1 項(xiàng)目難度的確定 難度分析的目的在于篩選項(xiàng)目 難度確定取決于測(cè)驗(yàn)的目的 性質(zhì)以及項(xiàng)目的形式 一般來說 P值越接近于0 50 區(qū)別力越高 為了使測(cè)驗(yàn)具有更大的區(qū)別力 各題目難度可考慮控制在0 50 0 20 當(dāng)測(cè)驗(yàn)用于選拔時(shí) 可較多地選擇難度接近于錄取率的項(xiàng)目 當(dāng)測(cè)驗(yàn)用于篩選或診斷出少數(shù)被試 則難度要比較低即P值要比較大 P390 100 2 測(cè)驗(yàn)難度的確定 整個(gè)測(cè)驗(yàn)的難度取決于組成項(xiàng)目的難度 如果測(cè)驗(yàn)分?jǐn)?shù)接近于常態(tài)分布 說明整個(gè)測(cè)驗(yàn)的難度較為恰當(dāng) 如果出現(xiàn)明顯的正偏態(tài)分布 說明難度偏大 可增加一些較容易的題目 如果出現(xiàn)明顯的負(fù)偏態(tài) 說明難度偏小 可增加一些難度較大的題目 P390 101 二 項(xiàng)目的區(qū)分度 1 項(xiàng)目區(qū)分度的定義 項(xiàng)目區(qū)分度也叫鑒別力 是指測(cè)驗(yàn)項(xiàng)目對(duì)被試的心理特性 傾向性或發(fā)展水平的區(qū)分能力 項(xiàng)目區(qū)分度的取值范圍在 1 1之間 主要是指項(xiàng)目得分與實(shí)際能力水平之間的相關(guān)程度 相關(guān)系數(shù)越大 區(qū)分度越高 P391 102 2 區(qū)分度的計(jì)算方法 1 鑒別指數(shù) 通常 以測(cè)驗(yàn)總分高分組 前27 和低分組 后27 在一項(xiàng)目上通過率或得分率之差作為該項(xiàng)目的鑒別指數(shù) 即D PH PL 美國測(cè)量專家伊貝爾 L Ebel 提出了一套項(xiàng)目鑒別指數(shù)的平均標(biāo)準(zhǔn) 0 40 很好0 30 0 39 良好 修改后更佳0 20 0 29 尚可 但需修改0 19以下 差 必須淘汰 P391 103 2 相關(guān)法 計(jì)算區(qū)分度最常用的方法是 以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)成績或測(cè)驗(yàn)成績總分的相關(guān)作為該項(xiàng)目區(qū)分度的指標(biāo) 相關(guān)越高 表明項(xiàng)目越具有區(qū)分功能 P392 104 3 區(qū)分度與難度的關(guān)系 一般來說 中等難度的項(xiàng)目區(qū)分度最大 但是區(qū)分度和難度都是相對(duì)的 有條件的 較難的項(xiàng)目對(duì)高水平的被試區(qū)分度高 較容易的項(xiàng)目對(duì)低水平的被試區(qū)分度高 中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高 測(cè)驗(yàn)中項(xiàng)目的難度分布最好也是常態(tài)分布的 其中很難的和很容易的項(xiàng)目都較少 中等難度的項(xiàng)目最多 平均難度在0 50左右 這樣可以提高整個(gè)測(cè)驗(yàn)的鑒別力 P392 105 下列公式中屬于難度計(jì)算的是 A R N 100 B P PH PL 2C KP 1 K 1 D D PH PL 能夠更好的區(qū)分被試之間差異的測(cè)驗(yàn)項(xiàng)目的難度一般是 A 0B 0 5C 1D 無所謂3 下列測(cè)題區(qū)分度D屬于很好的是 A 0 6B 0 41C 0 36D 0 284 對(duì)于選拔性測(cè)驗(yàn)來說 測(cè)驗(yàn)的難度應(yīng)該 A 較小B 中等C 較大D 無所謂5 對(duì)于診斷性測(cè)驗(yàn)來說 測(cè)驗(yàn)的難度應(yīng)該 A 較小B 中等C 較大D 無所謂 本節(jié)學(xué)習(xí)檢測(cè)題 106 第六節(jié)心理測(cè)驗(yàn)編制的程序 第一步測(cè)驗(yàn)的目標(biāo)分析 簡單地說 就是要 1 確定測(cè)量的對(duì)象群 即測(cè)量總體2 確定測(cè)量結(jié)果的用途3 確定測(cè)量的具體內(nèi)容 P394 107 1 測(cè)量的對(duì)象 測(cè)驗(yàn)編制前 要明確測(cè)驗(yàn)適應(yīng)的團(tuán)體 只有對(duì)受測(cè)者的年齡 受教育程度 社會(huì)經(jīng)濟(jì)地位和閱讀水平有清楚了解 測(cè)驗(yàn)編制才能做到有針對(duì)性 舉例來說 被試?yán)斫忸}意嗎 108 2 測(cè)量結(jié)果的用途 測(cè)驗(yàn)?zāi)康?結(jié)果的用途不同 測(cè)驗(yàn)的選材范圍和項(xiàng)目難度都會(huì)有所不同 P394 109 3 測(cè)量的目標(biāo) 測(cè)驗(yàn)?zāi)繕?biāo)就是縮編測(cè)驗(yàn)欲測(cè)量的心理變量或行為傾向 為使測(cè)驗(yàn)有效 需對(duì)測(cè)量目標(biāo)進(jìn)行分析 目標(biāo)分析可分為三種情況 1 工作分析 也叫任務(wù)分析 是針對(duì)特定領(lǐng)域或崗位的選拔性或預(yù)測(cè)性測(cè)驗(yàn)所進(jìn)行的目標(biāo)分析 分兩步 先確定特定工作或活動(dòng)取得高績效所需要的心理特質(zhì)或行為傾向 再建立考察被試績效的效標(biāo) 2 給特定概念下定義 即分析所要測(cè)量心理特質(zhì)或品質(zhì)的內(nèi)涵 并在此基礎(chǔ)上給出操作性定義 便于將抽象的心理特質(zhì)具體化 3 確定測(cè)驗(yàn)具體內(nèi)容 描述性顯示測(cè)驗(yàn)編制前 要確定測(cè)驗(yàn)所要顯示的內(nèi)容和技能 以便從中進(jìn)行內(nèi)容取樣 常使用雙向細(xì)目表 P395 110 第二步測(cè)題的編寫 目標(biāo)分析需要大量調(diào)研 而測(cè)題編寫時(shí) 也需要開展調(diào)研 以搜集可以寫進(jìn)測(cè)驗(yàn)的項(xiàng)目 下列資料是獲得測(cè)驗(yàn)項(xiàng)目的重要參考 1 已有標(biāo)準(zhǔn)測(cè)驗(yàn) 即從已有測(cè)驗(yàn)中選擇 修訂項(xiàng)目為新測(cè)驗(yàn)所用 2 理論和專家經(jīng)驗(yàn) 根據(jù)理論構(gòu)念 將其具體化為外顯行為 從而作為測(cè)題使用 專家經(jīng)驗(yàn)可直接提供測(cè)驗(yàn)題目 3 臨床醫(yī)生和護(hù)理人員 教師的觀察和工作記錄 這是測(cè)驗(yàn)行為取樣的主要源泉 如MMPI 羅夏墨跡測(cè)驗(yàn) 學(xué)習(xí)適應(yīng)性測(cè)驗(yàn)等 1 項(xiàng)目來源 P396 111 2 命題的一般原則 1 內(nèi)容方面 符合測(cè)驗(yàn)?zāi)康?避免貪多而亂出題 內(nèi)容取樣要有代表性 題目間互相獨(dú)立 且要盡量避免復(fù)合性測(cè)題 2 文字方面 使用準(zhǔn)確的當(dāng)代語言 避免生僻字詞 語句表述要充分 簡明扼要 一句話說明一個(gè)概念 即語義單一 明確 清晰 盡量不用雙重否定 3 理解方面 題目應(yīng)有確切答案 除創(chuàng)造力測(cè)驗(yàn)和人格測(cè)驗(yàn)外不應(yīng)具有引起爭議的可能 不要超出受測(cè)者的知識(shí)水平和理解力 4 社會(huì)敏感性方面 盡量避免有社會(huì)敏感性的問題 P396 112 2 編制要領(lǐng) 1 選擇題 2 是非題 3 簡答題 4 操作題 P396 113 第三步測(cè)驗(yàn)的編排和組織 1 試題形式的選擇 1 根據(jù)測(cè)驗(yàn)的目的和材料性質(zhì)選擇試題形式 2 根據(jù)受測(cè)者團(tuán)體的特點(diǎn)選擇試題形式 3 根據(jù)實(shí)際的制約因素選擇試題形式 如被試者人數(shù) 時(shí)間和經(jīng)費(fèi)限制等 P399 114 2 題目審定 是測(cè)驗(yàn)編制者或有關(guān)專家對(duì)題目反復(fù)審查修訂 改正意義不明確的詞語 取消一些重復(fù)和不適宜的題目 組成預(yù)備測(cè)驗(yàn) 題目審定時(shí)需要注意以下問題 1 除必要的調(diào)整外 審核題目的內(nèi)容及結(jié)構(gòu)是否與計(jì)劃一致 2 保留的題目數(shù)量應(yīng)比最后所需題數(shù)多出一倍至幾倍 以備篩選和制作復(fù)本使用 3 題目的難度要適當(dāng) 符合測(cè)驗(yàn)?zāi)康牡男枰?4 題目的說明必須清楚明白 P400 115 3 測(cè)題的編排 測(cè)驗(yàn)題目選出之后 根據(jù)測(cè)驗(yàn)的目的 性質(zhì) 被試的可能心理反應(yīng) 加以合理編排 一般應(yīng)依照以下原則 1 測(cè)題宜由易到難排列 2 盡可能將同類型的測(cè)題組合在一起 3 注意根據(jù)各種類型測(cè)題本身的特點(diǎn)排列題目 4 盡量將涉及個(gè)人敏感性話題的題目排在后邊 P400 116 測(cè)題的編排方式 1 并列直進(jìn)式 將整個(gè)測(cè)驗(yàn)的試題或項(xiàng)目按照性質(zhì)或測(cè)量目標(biāo)不同 單列為幾個(gè)分測(cè)驗(yàn) 此為 并列 而每個(gè)分量表中的項(xiàng)目由易到難排列 此為 直進(jìn) 通常 智力測(cè)驗(yàn)是采用這種排列方式 2 混合螺旋式 將整個(gè)測(cè)驗(yàn)的試題或項(xiàng)目按難度分層 然后在每一個(gè)難度層次里 將各分測(cè)驗(yàn)或分量表的項(xiàng)目交叉混排 使測(cè)驗(yàn)難度逐漸升進(jìn) 被試能較好維持作答興趣 如比內(nèi) 西蒙智力量表 P401 117 第四步預(yù)測(cè) 項(xiàng)目分析與修改 測(cè)驗(yàn)基本成型后 需要從目標(biāo)總體中選擇一定容量的樣本進(jìn)行預(yù)測(cè) 預(yù)測(cè)之后要做項(xiàng)目分析 以評(píng)估測(cè)驗(yàn)的質(zhì)量和為進(jìn)一步的修改完善提供客觀依據(jù) P401 118 1 預(yù)測(cè)的目的 預(yù)測(cè)的目的在于獲取被試對(duì)測(cè)題的反應(yīng)資料 以便從定性和定量兩方面分析測(cè)題乃至整個(gè)測(cè)驗(yàn)的質(zhì)量 比如 哪些題目的意義不清 容易引起誤解 是否存在時(shí)限長度不合適 某些題目容易引起被試反感等意想不到的情況 施測(cè)過程中是否還存在需要進(jìn)一步控制的因素等 P401 119 2 預(yù)測(cè)時(shí)應(yīng)注意的問題 1 預(yù)測(cè)對(duì)象應(yīng)來自目標(biāo)總體 取樣有代表性 規(guī)模要合適 2 預(yù)測(cè)的過程和環(huán)境應(yīng)盡量接近將來實(shí)際施測(cè)的過程和環(huán)境 3 預(yù)測(cè)的時(shí)限應(yīng)放寬 盡量讓每個(gè)被試將題目做完 4 預(yù)測(cè)過程中 隨時(shí)記錄被試反應(yīng) 如被試進(jìn)度 不理解的題 P401 120 3 預(yù)測(cè)后的項(xiàng)目分析與修改 預(yù)測(cè)后 對(duì)測(cè)題及整個(gè)測(cè)驗(yàn)進(jìn)行定性和定量分析 定性分析主要是關(guān)于題目的適切性 思想性 表達(dá)清晰性和準(zhǔn)確性等 定量分析主要是對(duì)預(yù)測(cè)資料進(jìn)行統(tǒng)計(jì)分析 以評(píng)估題目的難度 區(qū)分度 備選答案的合適度等 根據(jù)分析結(jié)果 對(duì)測(cè)驗(yàn)進(jìn)行修改和完善 包括修改 增刪項(xiàng)目 調(diào)整測(cè)驗(yàn)的編排結(jié)構(gòu)等 然后再預(yù)測(cè) 再分析 再修改 此過程可循環(huán)多次 以獲得滿意的測(cè)驗(yàn) P401 121 第五步質(zhì)量評(píng)估及其參數(shù)計(jì)算 測(cè)驗(yàn)編好后可在小范圍內(nèi)試用 以對(duì)其可信度和有效性進(jìn)行初步鑒定 確定其是否可用 被認(rèn)為是可用的測(cè)驗(yàn) 可以在一個(gè)較大的 代表性樣本中試測(cè) 并依據(jù)測(cè)驗(yàn)資料估價(jià)測(cè)驗(yàn)的信度 效度 P402 122 第六步常模制訂 常模是依據(jù)標(biāo)準(zhǔn)化樣本測(cè)量分?jǐn)?shù)分布模式制訂出來的 而標(biāo)準(zhǔn)化樣本就是來自目標(biāo)總體的較大的代表性樣本 將測(cè)驗(yàn)在標(biāo)準(zhǔn)化樣本中施測(cè) 然后將所得分?jǐn)?shù)進(jìn)行統(tǒng)計(jì)整理 形成一個(gè)具有代表性的分?jǐn)?shù)分布 即常模 常用的心理測(cè)驗(yàn)常模包括 百分位常模 標(biāo)準(zhǔn)分常模 發(fā)展常模及商數(shù)等 P402 123 第七步編寫指導(dǎo)手冊(cè) 指導(dǎo)手冊(cè)的內(nèi)容包括 1 測(cè)驗(yàn)的目標(biāo)和功用 2 測(cè)驗(yàn)的理論背景 材料選取的原則 方法和統(tǒng)計(jì)指標(biāo) 3 指導(dǎo)語 4 測(cè)驗(yàn)的標(biāo)準(zhǔn)答案或計(jì)分標(biāo)準(zhǔn) 5 常模資料 包括常模表 常模適用團(tuán)體 測(cè)驗(yàn)分?jǐn)?shù)的換算和解釋方法 6 測(cè)驗(yàn)的基本特征 難度 鑒別力 信度 效度和因素分析等資料 P402 124 1 命題的一般原則涉及以下 幾個(gè)方面 A 內(nèi)容B 文字C 理解D 社會(huì)敏感性2 題目審定時(shí) 可對(duì)初選的題目進(jìn)行刪減 一般保留的題目是 A 少于測(cè)驗(yàn)所需的題目 以便為增加新題目留有余地B 等于測(cè)驗(yàn)所需的題目C 多出一倍至幾倍 以便篩選和編制復(fù)本D 盡可能的多 以便精選項(xiàng)目3 心理測(cè)驗(yàn)常用的測(cè)題編排方式有 A 難以交叉式B 并列直進(jìn)式C 混合螺旋式D 隨意混排式 本節(jié)練習(xí)題 125 4 編制測(cè)驗(yàn)時(shí)進(jìn)行預(yù)測(cè)的目的是 A 對(duì)測(cè)題質(zhì)量進(jìn)行定性分析 B 對(duì)測(cè)題質(zhì)量進(jìn)行定量分析 C 測(cè)試時(shí)- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 心理測(cè)量學(xué) 基礎(chǔ)知識(shí)
鏈接地址:http://m.appdesigncorp.com/p-7688834.html