統(tǒng)計(jì)數(shù)據(jù)的搜集與整理.ppt
第二章第三節(jié)抽樣調(diào)查中的基本概念,3.1概率抽樣與非概率抽樣概率抽樣也稱隨機(jī)抽樣。概率抽樣:就是使總體中的每一個(gè)單位都有一個(gè)已知的、不為零的概率進(jìn)入樣本的抽樣方法。非概率抽樣:是指抽樣時(shí)不遵循隨機(jī)原則,而是按照研究人員的主觀經(jīng)驗(yàn)或其它條件來(lái)抽取樣本的一種抽樣方法,也就是說(shuō)在抽樣時(shí),總體單元的入樣概率事先未知,入樣與否與研究人員的經(jīng)驗(yàn)和主觀意志有很大關(guān)系。兩者的不同:是否遵循隨機(jī)原則非概率抽樣一般不能用數(shù)理統(tǒng)計(jì)方法進(jìn)行推斷。,3.2抽樣誤差和處理,抽樣誤差:由于個(gè)體存在差異,導(dǎo)致每個(gè)樣本的樣本統(tǒng)計(jì)量的值與總體參數(shù)之間存在的差異。影響抽樣誤差的因素:總體各單位標(biāo)志值的差異程度;樣本的單位數(shù);抽樣的方法;抽樣調(diào)查的組織形式。盡管抽樣誤差是無(wú)法避免的,但它卻是可以控制的。選擇適當(dāng)?shù)某闃臃椒ɑ蛘叱闃釉O(shè)計(jì)是控制這種誤差的一個(gè)重要方法。,第四節(jié)抽樣方法介紹,樣本不能準(zhǔn)確代表總體,在研究設(shè)計(jì)中會(huì)出現(xiàn)偏差:偏差:如果抽樣方法得到的結(jié)果與總體的真實(shí)情況存在系統(tǒng)性差距,那么我們說(shuō)這種抽樣方法存在偏差選擇性偏差:系統(tǒng)性趨勢(shì)排除或包括某一類單位無(wú)反應(yīng)偏差:樣本所選擇的單位不產(chǎn)生反應(yīng),而且與應(yīng)答者相比,它們具有非常不同的特性反應(yīng)偏差:調(diào)查者的提問(wèn)時(shí)間和提問(wèn)方式會(huì)對(duì)被調(diào)查單位做出的反應(yīng)產(chǎn)生影響,【例2-6】:電視節(jié)目就槍支控制問(wèn)題進(jìn)行了一項(xiàng)民意調(diào)查。電視觀眾被邀請(qǐng)就這一問(wèn)題發(fā)表自己的意見(jiàn)。你認(rèn)為民意調(diào)查結(jié)果值得信賴嗎?電視節(jié)目調(diào)查一般會(huì)產(chǎn)生偏差。因?yàn)檫@種調(diào)查是依據(jù)自愿抽樣方法進(jìn)行的,即只有那些觀看電視節(jié)目并對(duì)這一問(wèn)題有強(qiáng)烈意見(jiàn)的人才有可能接受調(diào)查。因此,調(diào)查結(jié)果存在偏差,不能真正加以信賴。,【例2-7】:電話調(diào)查:如果隨機(jī)從電話本上選取電話及其號(hào)碼進(jìn)行某項(xiàng)調(diào)查,請(qǐng)問(wèn)是否會(huì)產(chǎn)生偏差?由于只有那些將電話及其號(hào)碼印在電話本上的人才有機(jī)會(huì)被選入到樣本中,因此會(huì)出現(xiàn)選擇性偏差。,【例2-8】:郵件調(diào)查在大部分郵件調(diào)查中,較低和較高的社會(huì)階層一般不愿意對(duì)調(diào)查做出回答,這表面調(diào)查結(jié)果過(guò)于代表中層階級(jí)的觀點(diǎn)。這時(shí)會(huì)產(chǎn)生無(wú)反應(yīng)偏差。,【例2-9】:一名心理學(xué)家想要研究夫婦之間的分居問(wèn)題。此時(shí)你會(huì)遇到這樣一個(gè)問(wèn)題,“心理學(xué)家發(fā)現(xiàn)分居會(huì)削弱夫婦之間的感情,正如一句俗語(yǔ)所說(shuō),眼不見(jiàn),心不想。你能夠想象為什么會(huì)那樣嗎?”受訪者對(duì)結(jié)果并不感到奇怪。這名心理學(xué)家在不同的時(shí)候?qū)α硪唤M受訪者又進(jìn)行了同樣的調(diào)查,“心理學(xué)家發(fā)現(xiàn)分居會(huì)增強(qiáng)夫婦之間的感情。正如一句俗語(yǔ)所說(shuō),分離使愛(ài)心更濃。你能夠想象為什么會(huì)那樣嗎?”受訪者對(duì)結(jié)果并不感到奇怪。由于敘述中選用了不同的詞匯,因此調(diào)查結(jié)果出現(xiàn)了反應(yīng)偏差。,4.1隨機(jī)抽樣,簡(jiǎn)單隨機(jī)抽樣(純隨機(jī)抽樣)對(duì)總體單位不進(jìn)行任何分組排列,僅按隨機(jī)原則直接從總體中抽取樣本,以使總體中的每一個(gè)單位均有同等的被抽取的機(jī)會(huì)。一種基本的等概率抽樣方法,其他概率抽樣都可以看成是由它派生出來(lái)的。具體做法:直接抽選法抽簽法隨機(jī)數(shù)碼表法主要用于以下情況:對(duì)調(diào)查對(duì)象的情況很少了解;總體單位的排列沒(méi)有秩序;抽到的單位比較分散時(shí)也不影響調(diào)查工作。,4.2分層抽樣(類型抽樣),在分層隨機(jī)抽樣中,首先將總體分成若干層,然后從每一層中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本。每一層抽取的觀察值數(shù)量不僅能夠代表樣本的百分比,而且能夠代表總體的百分比。同一層的觀察值應(yīng)當(dāng)有相同的特征。不同層的觀察值會(huì)表現(xiàn)出不同的特征。具體步驟如下:第一,按照某一種或幾種特征對(duì)總體進(jìn)行分層。第二,確定在各層中抽取樣本單位的數(shù)量。可采取等比例和不等比例抽取兩種不同的方法。,分層抽樣抽樣的主要優(yōu)點(diǎn)有:提高從樣本推斷總體的精確性。分層抽樣特別適用于既要對(duì)總體參數(shù)進(jìn)行推斷,也要對(duì)各子總體(層)的參數(shù)進(jìn)行推斷的情形,例如一項(xiàng)全國(guó)性抽樣調(diào)查,若以省為層,那么調(diào)查以后即可進(jìn)行全國(guó)性的統(tǒng)計(jì),也可獲得各省的統(tǒng)計(jì)數(shù)據(jù)。分層抽樣實(shí)施起來(lái)靈活方便,而且便于組織。由于抽樣是在各層獨(dú)立進(jìn)行的,因此它允許根據(jù)不同層的情況采用不同的抽樣方法。分層抽樣要求:盡量使層(組)的分布與總體中個(gè)體的分布相似即要求層內(nèi)(組內(nèi))方差盡量小,而層間(組間)方差盡量大。分層抽樣的主要局限性:調(diào)查者必須對(duì)總體情況有較多的了解,否則無(wú)法進(jìn)行恰當(dāng)?shù)姆謱印?4.3等距抽樣,等距抽樣,又稱系統(tǒng)抽樣或機(jī)械抽樣。是對(duì)研究的總體按一定的順序排列,每隔一定的間隔抽取一個(gè)或若干個(gè)單位,并把這些抽取的單位組成樣本進(jìn)行觀察的一種抽樣方法。,雖然等距抽樣在概念方面與簡(jiǎn)單隨機(jī)抽樣很相似,但這種方法在實(shí)踐中更加容易實(shí)施。這種方法是以相等間隔從總體中抽取觀察值。等距抽樣的主要優(yōu)點(diǎn):易于實(shí)施,工作量少樣本在總體中的分布比較均勻,故而抽樣誤差小于或至多等于簡(jiǎn)單隨機(jī)抽樣,即較其精確。等距抽樣的弱點(diǎn):容易造成系統(tǒng)性誤差等距抽樣是以總體單位的無(wú)規(guī)律排列為前提的,其存在的一個(gè)潛在問(wèn)題是周期性,當(dāng)總體呈現(xiàn)周期性變化時(shí)會(huì)出現(xiàn)這種現(xiàn)象,而且周期長(zhǎng)度與我們采用系統(tǒng)抽樣觀察到的結(jié)果一樣。雖然周期性并不常見(jiàn),但在進(jìn)行等距抽樣時(shí)應(yīng)當(dāng)考慮到這個(gè)問(wèn)題。,4.4整群抽樣,整群抽樣又稱聚類抽樣把總體分成若干個(gè)組(或群)。每一組就好像是總體的縮影。然后從這些群中抽取若干群作為一個(gè)簡(jiǎn)單隨機(jī)樣本,對(duì)被抽中群的所有個(gè)體進(jìn)行全面調(diào)查。主要優(yōu)點(diǎn):易于取得抽樣框,便于組織,可以節(jié)省人力、物力和財(cái)力。最大缺點(diǎn):樣本分布不均勻,樣本的代表性差。它與其他抽樣方法相比,在樣本容量相同時(shí),其抽樣誤差較大。要求:要使整群抽樣的誤差小成為可能的話,在劃分群時(shí),應(yīng)使群內(nèi)方差盡可能大,而使群間方差盡可能小。,案例分析:,1936年美國(guó)總統(tǒng)大選,由民主黨人羅斯福對(duì)陣共和黨人蘭登。美國(guó)一著名雜志社作了一項(xiàng)民意調(diào)查,該雜志根據(jù)電話號(hào)碼簿、俱樂(lè)部名冊(cè)、駕駛證等隨機(jī)調(diào)查了大量的民眾。據(jù)其結(jié)果,該雜志預(yù)言蘭登將以壓倒性優(yōu)勢(shì)獲勝,但大選結(jié)果卻截然相反。試從抽樣的角度詮釋預(yù)測(cè)失敗的原因。究其原因,在于該雜志是從電話號(hào)碼簿、俱樂(lè)部名冊(cè)、駕駛證等去選擇被調(diào)查對(duì)象的,這類人多屬于富有階層,傾向共和黨者居多,這違反了隨機(jī)抽樣的原則,屬于便利抽樣。因此,這類教訓(xùn)應(yīng)在抽樣調(diào)查中汲取。-選擇性偏差是也。,