《《抽樣調(diào)查》PPT課件》由會員分享,可在線閱讀,更多相關(guān)《《抽樣調(diào)查》PPT課件(48頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、抽樣調(diào)查,侯震梅,統(tǒng)計認(rèn)識活動的一個重要環(huán)節(jié)是通過統(tǒng)計調(diào)查獲取數(shù)據(jù),然后再據(jù)以進(jìn)行科學(xué)的統(tǒng)計分析。 統(tǒng)計調(diào)查有多種,其中應(yīng)用最為廣泛的就是抽樣調(diào)查,可以說,抽樣調(diào)查是國際上通行的統(tǒng)計調(diào)查的主要方法之一. 目前我國1%人口抽樣調(diào)查、農(nóng)業(yè)抽樣調(diào)查、就業(yè)抽樣調(diào)查、工業(yè)企業(yè)調(diào)查、批發(fā)零售業(yè)和餐飲業(yè)抽樣調(diào)查已列入國家統(tǒng)計調(diào)查制度。,抽樣調(diào)查的基本概念,抽樣調(diào)查(sampling survey)是使用頻率最高的一種調(diào)查方式,它是按照一定程序,從所研究對象的全體(總體)中抽取一部分(樣本)進(jìn)行調(diào)查或觀察,獲得對總體的數(shù)量特征的估計和推斷。,根據(jù)“單元是否按照一定的概率入樣”進(jìn)行分類:,隨機(jī)(概率)抽樣(pr
2、obability sampling ) 非隨機(jī)(非概率)抽樣(non- probability sampling ),隨機(jī)抽樣是指按照概率原則,從總體中抽取一定數(shù)目的單位作為樣本進(jìn)行觀察,隨機(jī)抽樣使總體中每個單位都有一定的概率被選入樣本,從而使根據(jù)樣本所做出的結(jié)論對總體具有充分的代表性。 非隨機(jī)抽樣是以方便為出發(fā)點(diǎn)或根據(jù)研究者主觀的判斷來抽取樣本。非隨機(jī)抽樣主要依賴研究者個人的經(jīng)驗(yàn)和判斷,它無法估計和控制抽樣誤差,無法用樣本的量化數(shù)據(jù)來推斷總體。,抽樣調(diào)查的作用,可以承擔(dān)全面調(diào)查無法勝任的項(xiàng)目。對那些不可能進(jìn)行全面調(diào)查或普查的總體,只能進(jìn)行抽樣調(diào)查; 節(jié)約費(fèi)用; 調(diào)查周期短,時效性強(qiáng); 有助
3、于提高調(diào)查數(shù)據(jù)的質(zhì)量。,抽樣調(diào)查發(fā)展史,1、1802年Laplace用抽樣法推斷法國人口。 比較完整的早期抽樣調(diào)查的例子是法國數(shù)學(xué)家Laplace對人口的抽樣調(diào)查。 2、1903年挪威統(tǒng)計學(xué)家凱爾的抽樣調(diào)查方法被國際統(tǒng)計學(xué)會(ISI)承認(rèn)。 竭力提出并推行抽樣調(diào)查的先驅(qū)者是挪威統(tǒng)計局的凱爾,于1895年在國際統(tǒng)計學(xué)會第五次大會上提出的,當(dāng)時稱之為代表性抽樣。1903年,國際統(tǒng)計會第九次大會取得一項(xiàng)決議,推薦使用凱爾提出的抽樣方法。,,3、1906年英國統(tǒng)計學(xué)家Bowley提出簡單抽樣理論。 1906年英國人鮑利提出中心極限定理,為抽樣調(diào)查奠定了理論基礎(chǔ),1925年的國際統(tǒng)計大會才承認(rèn)隨機(jī)抽樣的
4、可行性和有效性。 4、1934年Neyman提出分層抽樣 1934年,奈曼發(fā)表的著名論文“代表性抽樣的兩種方法:分層抽樣方法和目的抽樣方法”是現(xiàn)代抽樣調(diào)查理論發(fā)展史上的一個里程碑。 5、1947年聯(lián)合國推廣應(yīng)用。 美國政府在就業(yè)、人口、農(nóng)業(yè)等方面大力推廣抽樣調(diào)查,出現(xiàn)了一大批著名的抽樣調(diào)查專家,包括戴明、漢森、赫維茨、麥多等。,我國抽樣調(diào)查的發(fā)展,清華大學(xué)教授陳達(dá)主持云南呈貢縣人口普查,調(diào)查后用抽樣方法進(jìn)行核對比較,并發(fā)表論文人口普查選擇研究。 解放后,統(tǒng)計工作主要學(xué)習(xí)蘇聯(lián),1955年開始農(nóng)民家計抽樣調(diào)查,1963年成立農(nóng)產(chǎn)量調(diào)查隊(duì)。 1981國家統(tǒng)計局籌建農(nóng)村抽樣調(diào)查隊(duì)和城市抽樣調(diào)查隊(duì)。,抽
5、樣調(diào)查應(yīng)用舉例,1、人口調(diào)查:我國每10年一次普查,每年進(jìn)行人口變動量的抽樣調(diào)查。 美國用抽樣調(diào)查數(shù)據(jù)提供有關(guān)人口、勞動就業(yè)、失業(yè)情況的基礎(chǔ)數(shù)據(jù)。 2、經(jīng)濟(jì)調(diào)查:農(nóng)作物的播種面積和產(chǎn)量的抽樣調(diào)查。 農(nóng)村經(jīng)濟(jì)抽樣調(diào)查:農(nóng)民的生產(chǎn)、收入、分配、積累、消費(fèi)調(diào)查。 1982年4月起進(jìn)行物價抽樣調(diào)查:產(chǎn)品質(zhì)量抽樣調(diào)查,3、社會調(diào)查: 公眾和民意抽樣調(diào)查。 1990年婦女社會地位抽樣調(diào)查 1992年中國兒童情況抽樣調(diào)查 對技術(shù)人員狀況、對公眾科學(xué)態(tài)度調(diào)查. 4、衛(wèi)生調(diào)查 預(yù)防接種調(diào)查、流行病調(diào)查 1998年,第二次國家衛(wèi)生服務(wù)調(diào)查 5、環(huán)境調(diào)查 耕地、森林、草原、能源、動物、害蟲、大氣、水質(zhì)。,抽樣調(diào)查應(yīng)
6、用舉例,關(guān)于抽樣調(diào)查設(shè)計與分析的若干問題,近二十年來,人們對信息的要求日益強(qiáng)烈,抽樣調(diào)查作為十分時髦而又重要的統(tǒng)計調(diào)查方法已得到廣泛的重視。 一項(xiàng)抽樣調(diào)查,除了必要的經(jīng)費(fèi)和組織保證外,他的成功與否主要取決于它的設(shè)計與分析。,一、抽樣設(shè)計的目標(biāo)與準(zhǔn)則,(1)目地性:整個抽樣設(shè)計,包括抽樣框的設(shè)計、樣本容量的設(shè)計、抽樣方法的設(shè)計、估計量的設(shè)計、調(diào)查方法與問卷的設(shè)計,都必須以研究目地為依據(jù),服務(wù)于研究目地。 (2)可度量型:是指能用樣本自身計算出調(diào)查得到的估計值的有效性,即能算出估計值可能的誤差范圍。 (3)可行性:指能否基本上按預(yù)定的設(shè)計完成調(diào)查。 (4)經(jīng)濟(jì)性:即以最小的費(fèi)用實(shí)現(xiàn)調(diào)查目標(biāo)。,二、
7、任意抽樣、判斷抽樣與概率抽樣,樣本的抽取方法有兩大類:概率抽樣與非概率 抽樣。 概率抽樣也稱隨機(jī)抽樣,其基本特征是對總 體中的每一個可能樣本都以確定的概率來抽取樣 本,而不是根據(jù)某種準(zhǔn)則來挑選樣本。概率抽樣 能保證樣本的代表性,根據(jù)樣本數(shù)據(jù)獲得總體目 標(biāo)量估計的同時,獲得對這種估計的精度估計。,,任意抽樣的結(jié)果是不可靠的,其作用非常 有限,因?yàn)樗脴颖緦傮w沒有代表性。判 斷抽樣的效果取決于調(diào)查的經(jīng)驗(yàn)和判斷。,三、調(diào)查的形式與調(diào)查表的設(shè)計,調(diào)查的形式取決于調(diào)查的內(nèi)容和調(diào)查者的 能力。目前大多數(shù)調(diào)查項(xiàng)目,特別是社會與 經(jīng)濟(jì)調(diào)查或?qū)θ说囊庀蚺c行為調(diào)查,通常采 用問卷調(diào)查的形式。,四、抽樣調(diào)查的誤
8、差、精度與樣本量,抽樣調(diào)查中的誤差分為抽樣誤差與非抽樣誤差。 非抽樣誤差:調(diào)查誤差(測量誤差)、單元無回 答、抽樣框不完整、數(shù)據(jù)錄入產(chǎn)生的誤差。 抽樣誤差:樣本估計總體產(chǎn)生的,大小取決于樣本 量,樣本量越大,精度越高。 我們的目的是在可能費(fèi)用的條件下,盡可能提高精度;或者在要求保證給定精度的條件下,使費(fèi)用盡可能的節(jié)省。,五、抽樣單元的劃分與抽樣框的準(zhǔn)備,對抽樣單元的合理劃分及一份完整的抽樣框 是進(jìn)行概率抽樣的前提。抽樣單元可直接采用 自然單位或各級行政單位,例如在電視收視率 的調(diào)查中,可以將每個電視觀眾作為抽樣單 元,也可將每個擁有電視機(jī)的家庭作為抽樣單 元。,六、設(shè)計效應(yīng)與樣本量的確定,
9、樣本量的確定取決于對精度的要求以及費(fèi)用的限制。對簡單隨機(jī)抽樣有比較簡單的確定方法,對于其他的設(shè)計需要設(shè)計效應(yīng)。,七、總體目標(biāo)量的估計與方差估計,抽樣調(diào)查的目的是通過樣本數(shù)據(jù)對總體目標(biāo)量進(jìn)行估計。 本課程將集中介紹常用的抽樣方法、目標(biāo)量的估計方法及誤差的估計方法。,,方差與偏量,信度,效度,,,,,,S(),B(),均方誤差=方差+偏倚平方 幾何意義:,誤差限與置信度,估計量的誤差通常用誤差限來表示。 置信度為 的絕對誤差限滿足 置信度為 的相對誤差限 r 滿足,只要n充分大,估計量 的分布是近似正態(tài)分布的,,對可用估計量,它必定是近似無偏的,因此有,八、不回答的影響與處理,替換樣本問題 加權(quán)
10、調(diào)整 沃納隨機(jī)化回答模型,,1、 抽樣調(diào)查 孫山澤著 2、 抽樣技術(shù)及其應(yīng)用杜子芳著 3、 Survey Sampling Kish著 4、 抽樣技術(shù) 金勇進(jìn)著,參考書目,基本要求,1. 掌握各種抽樣估計的基本思想 2. 掌握抽樣估計的計算方法和公式 3. 案例分析 4. 抽樣調(diào)查實(shí)踐,第一章 引 言,1.1 概率抽樣調(diào)查 1.2 有限總體抽樣的樣本分布 1.3 概率抽樣的幾種基本的抽樣方法,概率抽樣調(diào)查,(1)概率抽樣調(diào)查的的定義 概率抽樣調(diào)查是在非全面調(diào)查中運(yùn)用概率統(tǒng)計理論指導(dǎo)的抽樣方法,按隨機(jī)的原則從全部研究對象中抽取一部分單位代表總體進(jìn)行研究,并依據(jù)所獲得的數(shù)據(jù)對全部研究對
11、象的數(shù)量特征做出具有一定可靠性的估計判斷,來認(rèn)識總體的一種統(tǒng)計方法。,隨機(jī)性,,代表性,總體性,,推斷,抽樣的隨機(jī)性決定了樣本的代表性,才能用樣本推斷出總體的數(shù)量特征。,,,數(shù)量特征,總體分布,事件概率,(2)概率抽樣的原理,,(3)概率抽樣調(diào)查的優(yōu)越性,a. 適用面廣、較高精確性。科學(xué)的抽樣手段使數(shù)據(jù)有代表性, 可靠的數(shù)學(xué)方法使結(jié)果有精確性 b. 抽樣誤差可以進(jìn)行計算并加以控制 c.節(jié)省費(fèi)用,節(jié)省人、財、物,時效性強(qiáng) d. 可用專用設(shè)備和高質(zhì)量的專業(yè)人員,概率抽樣的幾種基本的抽樣方法,1. 簡單隨機(jī)抽樣:對中取出個樣本,每一樣本出現(xiàn)的概率相同,有放回與無放回。 2. 系統(tǒng)抽樣(機(jī)械抽樣或等距
12、抽樣):將總體單元按某種順序,將個個體序號1,2,,N對應(yīng),然后選數(shù)k, 將個體順序排列如下,直至N個個體排完,對號碼1,2,,k作簡單隨機(jī)抽樣,第i個入樣,則k+i, 2k+i, ,均入樣,或采用頭尾相接。,2.不等概抽樣:對總體不同的單元有不同的入樣概率。 3. 分層抽樣:將總體分成若干個小總體(層),在每層中抽取樣本,將各層的樣本和在一起組成員總體的一個分層樣本。 4. 多階抽樣:將總體分成若干個小總體,但并不在每一小總體中抽取樣本,而將這些小群體稱為第一抽樣單元,將他們看作個體進(jìn)行抽樣。 5. 多重抽樣:對總體進(jìn)行一次以上的抽樣。,,本書所討論的抽樣均指概率抽樣,還需指出一些非概率抽樣
13、的方法, a.便利抽樣:也稱為任意抽樣偶遇抽樣,是指調(diào)查者為了方便而任意抽取樣本單位的一種抽樣方法。例如,要了解某種商品使用的普遍程度,調(diào)查員在道路、商店、學(xué)校等場所隨便選擇部分人作為樣本進(jìn)行調(diào)查。,b. 判斷抽樣:也稱為立意抽樣,指的是由抽樣者根據(jù)自己的主觀經(jīng)驗(yàn)抽取樣本。 c. 重點(diǎn)抽樣:只對總體中的重點(diǎn)單元進(jìn)行特征測量的調(diào)查 例如,調(diào)查我國鋼鐵行業(yè)的現(xiàn)狀,則只對寶鋼、鞍鋼、首鋼等幾家大型企業(yè)進(jìn)行調(diào)查。 d. 滾雪球抽樣:利用樣本點(diǎn)尋找樣本點(diǎn)。 e. 配額抽樣:先將總體中的所有單元按一定分類標(biāo)志分為若干類,然后在每類中采用便利抽樣或判斷抽樣的方式選取樣本。樣本的類別結(jié)構(gòu)與總體大致成比例。 可
14、以看出,重點(diǎn)抽樣與典型抽樣查都屬于判斷抽樣。,2、抽樣調(diào)查的操作流程 建立課題,明確調(diào)查的目的 調(diào)查的準(zhǔn)備階段 a. 總體及目標(biāo)量的確定 總體為想要達(dá)到調(diào)查目的所要關(guān)注的集合, 即所有調(diào)查客體的集合,相應(yīng)的構(gòu)成總體的調(diào)查 客體稱為個體。,抽樣單元:將總體分成有限個互不相重合的部分,每個部分稱為單元.單元比個體的概念要廣泛,可以是一個個體,也可以是多個個體的集合 單元可大可小,單元又可分為小的單元。 b. 抽樣框:是一個包含總體全部單元及其主要特征的圖表。 抽樣框的基本形式:名單抽樣框、區(qū)域抽樣框、時間抽樣框。 c. 收集數(shù)據(jù)的方法 d. 抽樣設(shè)計,總 體,,次級單元,初級單元,,次級單元,次
15、級單元,初級單元,全國,,省,,縣,,全 國,城市1,城市2,城市,城市4,,居 委 會,居 委 會,居 委 會,,住 戶,住 戶,住 戶,,一覽表式抽樣框,,地圖抽樣框,e. 問卷設(shè)計 3. 現(xiàn)場工作階段 4. 數(shù)據(jù)處理階段 5. 寫出報告、結(jié)論,1.2 有限總體抽樣的樣本分布,由于本書研究的大規(guī)模抽樣調(diào)查對象是一個有限總體,總體中的單元是可識別。引入符號:總體有N個單元,N已知數(shù),設(shè)總體的每個單元用Ui表示,則有限總體記為,抽取的方案使每一可能的樣本以一個確定的出現(xiàn)概率,因此構(gòu)成了由抽樣設(shè)計形成的樣本概率分布,基于此分布我們可算樣本統(tǒng)計量的期望、方差等。這些期望、方差稱為基于設(shè)計的期望、方差。 例1 有放回的簡單隨機(jī)抽樣。每一樣本出現(xiàn)的概率為 例2.不放回的簡單隨機(jī)抽樣,每一樣本出現(xiàn)的概率為 記一個可能的樣本為s,在抽樣設(shè)計下出現(xiàn)此樣本的概率為p(s), 對任意單元Yk,, 對包含Yk,的s求和,稱為入樣概率。,,命題 1 對簡單隨機(jī)抽樣有,命題 2 對簡單隨機(jī)抽樣有,由樣本對總體 的指標(biāo)進(jìn)行估計,本書的主要內(nèi)容就是如何求出這幾個指標(biāo):總量、平均、方差、比例。,