《抽樣技術(shù)》第四版習(xí)題答案
《《抽樣技術(shù)》第四版習(xí)題答案》由會員分享,可在線閱讀,更多相關(guān)《《抽樣技術(shù)》第四版習(xí)題答案(54頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第2章 解: 這種抽樣方法是等概率的。在每次抽取樣本單元時,尚未被抽中的編號為1~64的這些單元中每一個單元被抽到的概率都是。 這種抽樣方法不是等概率的。利用這種方法,在每次抽取樣本單元時,尚未被抽中的編號為1~35以及編號為64的這36個單元中每個單元的入樣概率都是,而尚未被抽中的編號為36~63的每個單元的入樣概率都是。 這種抽樣方法是等概率的。在每次抽取樣本單元時,尚未被抽中的編號為20 000~21 000中的每個單元的入樣概率都是,所以這種抽樣是等概率的。 解: 項目 相同之處 不同之處 定義 都是根據(jù)從一個總體中抽樣得到的樣本,然后定義樣本均值為。 抽樣理論
2、中樣本是從有限總體中按放回的抽樣方法得到的,樣本中的樣本點不會重復(fù);而數(shù)理統(tǒng)計中的樣本是從無限總體中利用有放回的抽樣方法得到的,樣本點有可能是重復(fù)的。 性質(zhì) (1) 樣本均值的期望都等于總體均值,也就是抽樣理論和數(shù)理統(tǒng)計中的樣本均值都是無偏估計。 (2) 不論總體原來是何種分布,在樣本量足夠大的條件下,樣本均值近似服從正態(tài)分布。 (1) 抽樣理論中,各個樣本之間是不獨立的;而數(shù)理統(tǒng)計中的各個樣本之間是相互獨立的。 (2) 抽樣理論中的樣本均值的方差為,其中。在數(shù)理統(tǒng)計中,,其中為總體的方差。 解:首先估計該市居民日用電量的95%的置信區(qū)間。根據(jù)中心極限定理可知,在大樣本的條件下,
3、近似服從標(biāo)準(zhǔn)正態(tài)分布, 的的置信區(qū)間為。 而中總體的方差是未知的,用樣本方差來代替,置信區(qū)間為。 由題意知道,,而且樣本量為,代入可以求得 。將它們代入上面的式子可得該市居民日用電量的95%置信區(qū)間為。 下一步計算樣本量。絕對誤差限和相對誤差限的關(guān)系為。 根據(jù)置信區(qū)間的求解方法可知 根據(jù)正態(tài)分布的分位數(shù)可以知道,所以。也就是。 把代入上式可得,。所以樣本量至少為862。 解:總體中參加培訓(xùn)班的比例為,那么這次簡單隨機抽樣得到的的估計值的方差,利用中心極限定理可得在大樣本的條件下近似服從標(biāo)準(zhǔn)正態(tài)分布。在本題中,樣本量足夠大,從而可得的的置信區(qū)間為。 而這里的是未知的,我
4、們使用它的估計值。所以總體比例的的置信區(qū)間可以寫為,將代入可得置信區(qū)間為。 解:利用得到的樣本,計算得到樣本均值為,從而估計小區(qū)的平均文化支出為144.5元??傮w均值的的置信區(qū)間為,用來估計樣本均值的方差。 計算得到,則,,代入數(shù)值后計算可得總體均值的95%的置信區(qū)間為。 解:根據(jù)樣本信息估計可得每個鄉(xiāng)的平均產(chǎn)量為1 120噸,該地區(qū)今年的糧食總產(chǎn)量的估計值為(噸)。 總體總值估計值的方差為,總體總值的的置信區(qū)間為,把 代入,可得糧食總產(chǎn)量的的置信區(qū)間為。 解:首先計算簡單隨機抽樣條件下所需要的樣本量,把帶入公式,最后可得。 如果考慮到有效回答率的問題,在有效回答率為70%
5、時,樣本量應(yīng)該最終確定為。 解:去年的化肥總產(chǎn)量和今年的總產(chǎn)量之間存在較強的相關(guān)性,而且這種相關(guān)關(guān)系較為穩(wěn)定,所以引入去年的化肥產(chǎn)量作為輔助變量。于是我們采用比率估計量的形式來估計今年的化肥總產(chǎn)量。去年化肥總產(chǎn)量為。利用去年的化肥總產(chǎn)量,今年的化肥總產(chǎn)量的估計值為噸。 解:本題中,簡單估計量的方差的估計值為=37.17。 利用比率估計量進行估計時,我們引入了家庭的總支出作為輔助變量,記為。文化支出屬于總支出的一部分,這個主要變量與輔助變量之間存在較強的相關(guān)關(guān)系,而且它們之間的關(guān)系是比較穩(wěn)定的,且全部家庭的總支出是已知的量。 文化支出的比率估計量為,通過計算得到,而,則,文化支出的比
6、率估計量的值為(元)。 現(xiàn)在考慮比率估計量的方差,在樣本量較大的條件下,,通過計算可以得到兩個變量的樣本方差為,之間的相關(guān)系數(shù)的估計值為,代入上面的公式,可以得到比率估計量的方差的估計值為。這個數(shù)值比簡單估計量的方差估計值要小很多。全部家庭的平均文化支出的的置信區(qū)間為,把具體的數(shù)值代入可得置信區(qū)間為。 接下來比較比估計和簡單估計的效率,,這是比估計的設(shè)計效應(yīng)值,從這里可以看出比估計量比簡單估計量的效率更高。 解:利用簡單估計量可得,樣本方差為,,樣本均值的方差估計值為。 利用回歸估計的方法,在這里選取肉牛的原重量為輔助變量。選擇原重量為輔助變量是合理的,因為肉牛的原重量在很大程度上影
7、響著肉牛的現(xiàn)在的重量,二者之間存在較強的相關(guān)性,相關(guān)系數(shù)的估計值為,而且這種相關(guān)關(guān)系是穩(wěn)定的,這里肉牛的原重量的數(shù)值已經(jīng)得到,所以選擇肉牛的原重量為輔助變量。 回歸估計量的精度最高的回歸系數(shù)的估計值為?,F(xiàn)在可以得到肉?,F(xiàn)重量的回歸估計量為,代入數(shù)值可以得到。 回歸估計量的方差為,方差的估計值為,代入相應(yīng)的數(shù)值, ,顯然有。在本題中,因為存在肉牛原重量這個較好的輔助變量,所以回歸估計量的精度要好于簡單估計量。 第3章 3.1 解:在分層隨機抽樣中,層標(biāo)志的選擇很重要。劃分層的指標(biāo)應(yīng)該與抽樣調(diào)查中最關(guān)心的調(diào)查變量存在較強的相關(guān)性,而且把總體劃分為幾個層之后,層應(yīng)該滿足:層內(nèi)之間的差異盡可
8、能小,層間差異盡可能大。這樣才能使得最后獲得的樣本有很好的代表性。對幾種分層方法的判斷如下: (1)選擇性別作為分層變量,是不合適的。首先,性別這個變量與研究最關(guān)心的變量(不同職務(wù),職稱的人對分配制度改革的態(tài)度)沒有很大的相關(guān)性;其次,用性別作為分層變量后,層內(nèi)之間的差異仍然很大,相反,層之間的差異不是很大,因為男性和女性各自內(nèi)部的職務(wù),職稱也存在很大的差別;最后,選擇性別作為分層變量后,需要首先得到男性和女性的抽樣框,這樣會更加麻煩,也會使抽樣會變得更加復(fù)雜。 (2)按照教師、行政管理人員和職工進行分層,是合適的。這種分層的指標(biāo)與抽樣調(diào)查研究中最關(guān)心的變量高度相關(guān),而且按照這種方法分層后
9、,可以看出層內(nèi)對于分配制度改革的態(tài)度差異比較小,因為他們屬于相同的階層,而層之間的態(tài)度的差異是比較大的。這樣選取出來的樣本具有很好的代表性。 (3)按照職稱(正高、副高、中級、初級和其他)分層,也是合理的。理由與(2)相同,這樣進行分層的變量選擇與調(diào)查最關(guān)心的變量是高度相關(guān)的,分層后的層滿足分層的要求。所以,按照職稱進行分層是合理的。 (4)按照部門進行分層,是合理的。因為學(xué)校有很多院、系或者所,直接進行簡單隨機抽樣,有可能樣本不能很好地代表各個院系,最關(guān)心的變量與部門也存在一定的相關(guān)性。這樣分層后,每個層的總體數(shù)目和抽取的樣本量都較小,最終的樣本的分布比較均勻,比簡單隨機抽樣更加方便實施
10、。 3.2 解:設(shè)計的方案如下: 第一種方案:可以按照不同的專業(yè)進行分層,但是考慮到如果在每層都抽取,不能保證每個新生的入樣概率相等,因為每個專業(yè)的人數(shù)比例未知,8個人的樣本量無法在每個層之間進行分配。所以采取如下方法:對所有的新生按照專業(yè)的先后順序進行編號,使得每個專業(yè)的人的編號在一起,然后隨機選取出一個號碼,然后選取出這個號碼所在的專業(yè),選取出這個專業(yè),再在這個專業(yè)的所有新生中按照簡單隨機抽樣的方法選取出8個人。這樣就可以保證每個人入選的概率是相等的。 第二種方案:也可以按照性別進行分類,對他們進行編號,為1~800,使得男生的編號都在一起,女生的編號也都在一起,然后隨機選取出一個
11、號碼,然后看這個號碼所對應(yīng)的性別,然后從這個性別的所有人中按照簡單隨機抽樣的方法選取出8個新生。這樣就可以保證所有的新生的入樣概率是相同的。 第三種方案:隨機地把所有的人分成8組,而且使得每組的人都是100個人,這樣分組完成后,每個組的新生進行編號為1~100,然后隨機抽取出一個號碼,再從所有的小組中抽取出號碼所對應(yīng)的新生,從而抽取出8個人。 3.3 解:(1) 首先計算出每層的簡單估計量,分別為,其中,,則每個層的層權(quán)分別為; 則利用分層隨機抽樣得到該小區(qū)居民購買彩票的平均支出的估計量,代入數(shù)值可以得到。 購買彩票的平均支出的的估計值的方差為,此方差的估計值為,根據(jù)數(shù)據(jù)計算可以得
12、到每層的樣本方差分別為: 其中,代入數(shù)值可以求得方差的估計值為,則估計的標(biāo)準(zhǔn)差為。 (2)由區(qū)間估計可知相對誤差限滿足 所以,。 樣本均值的方差為,從而可以得到在置信度為,相對誤差限為條件下的樣本量為。 ①對于比例分配而言,有成立,那么,把相應(yīng)的估計值和數(shù)值代入后可以計算得到樣本量為,相應(yīng)的在各層的樣本量分別為。 ②按照內(nèi)曼分配時,樣本量在各層的分配滿足,這時樣本量的計算公式變?yōu)?,把相?yīng)的數(shù)值代入后可得,在各層中的分配情況如下:。 3.4 解:(1) 首先計算得到每層中在家吃年夜飯的樣本比例為,那么根據(jù)每一層的層權(quán),計算得到該市居民在家吃年夜飯的樣本比例為。 每一層中
13、在家吃年夜飯的樣本比例的方差為,則該市居民在家吃年夜飯的比例的方差,在的條件下, ,而其中每層的吃年夜飯的樣本比例的方差的估計值為,則樣本比例的方差的估計值為,把相應(yīng)的數(shù)值代入計算可得方差的估計值為,從而可以得到該估計值的標(biāo)準(zhǔn)差為。 (2)利用上題的結(jié)果,,這里的方差是,在的條件下,近似有。 ①比例分配的條件下,有成立,那么,把相應(yīng)的估計值和數(shù)值代入可以求得最終的樣本量應(yīng)該是,樣本量在各層的分配是,, 。 ②內(nèi)曼分配條件下,,則,代入相應(yīng)的估計值和數(shù)值可以計算得到樣本量為,在各層中樣本量的分配為。 3.5 解:總體總共分為10個層,每個層中的樣本均值已經(jīng)知道,層權(quán)也得到,從而可以計
14、算得到該開發(fā)區(qū)居民購買冷凍食品的平均支出的估計值為。 下一步計算平均支出的95%的置信區(qū)間,首先計算購買冷凍食品的平均支出的估計值的方差,其中,但是每層的方差是未知,則樣本平均支出的方差的估計值為,每個層的樣本標(biāo)準(zhǔn)差已知,題目中已經(jīng)注明各層的抽樣比可以忽略,計算可以得到。則這個開發(fā)區(qū)的居民購買冷凍食品的平均支出置信區(qū)間為 代入數(shù)值后,可得最終的置信區(qū)間為。 3.6 解:首先計算簡單隨機抽樣的方差,根據(jù)各層的層權(quán)和各層的總體比例可以得到總體的比例為,則樣本量為100的簡單隨機樣本的樣本比例的方差為 ,不考慮有限總體校正系數(shù),,其中, 在的條件下,通過簡單隨機抽樣得到的樣本比例的方
15、差為 通過分層抽樣得到的樣本比例的方差為,但是因為不考慮有 限總體校正系數(shù),而且抽樣方式是比例抽樣,所以有成立,樣本比例的方差近似為。對于每一層,分別有,在的條件下,近似的有成立,有 樣本量應(yīng)該滿足,同時這里要求分層隨機抽樣得到的估計的方差和簡單抽 樣的方差是相同的,,層權(quán)分別為,代入數(shù)值,可以計算得到最終的樣本量為。 3.7解:事后分層得到的總體均值的估計量和估計量的方差分別為 ,估計量的方差的估計值 。 對于幾種說法的判斷如下: (1)事后分層比簡單隨機抽樣產(chǎn)生更加精確的結(jié)果,這個說法是錯誤的。從事后分層得到估計量的方差的估計值來看,它的方差不一定
16、比簡單隨機抽樣的要小,而且從事后分層得到的樣本是利用簡單隨機抽樣的方法得到的,只是在計算估計量和估計量的方差時是按照分層隨機抽樣來處理,而且事后分層要求層權(quán)是已知的,但是當(dāng)層權(quán)未知從而利用樣本來估計層權(quán)時,就會產(chǎn)生偏差,事后分層不見得比簡單隨機抽樣產(chǎn)生更精確的結(jié)果。 (2)事后分層比按比例分配產(chǎn)生更精確的結(jié)果,這個說法是錯誤的。從事后分層得到的估計量的方差的估計值可以看出,它的第一項就是按照比例分層抽樣得到的估計量方差的估計值,公式中的第二項表示的是按事后分層時各層樣本量與按照比例分層時各層樣本量發(fā)生偏差所引起的方差的增量。 (3)事后分層的最優(yōu)分配產(chǎn)生更精確的結(jié)果,這種說法是錯誤的。事后
17、分層在樣本量足夠大的條件下是與比例分層相當(dāng)?shù)模窃谝话銞l件下,事后分層的精度仍然低于比例分層的,那么事后分層的精度也會高于最優(yōu)分配的精度。 (4)在抽樣時不能得到分層變量,這個說法是正確的。事后分層在抽樣時,是利用簡單隨機抽樣的方法,在抽樣時不涉及按照變量進行分層,至于按變量進行分層,是在抽樣完成后,然后根據(jù)具體的變量來對樣本進行分層。 (5)它的估計量的方差與真正按照比例分層隨機抽樣的方差差不多,只有在樣本量足夠大的條件下才成立。在樣本量足夠大的條件下,從事后分層的方差的計算公式可以看出,它的第二項會趨于0,這時事后分層的估計量的方差和分層隨機抽樣的方差差不多。 3.8 解:(1)
18、根據(jù)簡單隨機抽樣的公式,登記原始憑證的差錯率的估計值為 ,在考慮到的條件下,登記的原始憑證的差錯率的估計量的方差近似為 則估計量的方差的估計值為,計算得,則原始憑證的差錯率的估計的標(biāo)準(zhǔn)差為。 (2)這里,每個層的層權(quán)是事先知道的,那么利用事后分層來計算登記原始憑證的差錯率的估計值為,在這里。 利用事后分層得到的原始憑證的差錯率的估計量的方差的估計值為 ,在不考慮有限校正系數(shù)的條件下,又可以寫為 ,其中 ,可以得到,則相應(yīng)的標(biāo)準(zhǔn)差為 。 3.9 解:(1)所有可能的樣本的數(shù)量為,所有的樣本如下: (2)我們用9個樣本中的一個來計算
19、,假定抽中的樣本為。 首先按照分別比估計來估計,首先可以得到分層后的輔助變量的總體均值分別為 。在這個樣本中,經(jīng)計算得到,,而且,則根據(jù)分別比估計可得的估計值為 。 利用聯(lián)合比估計時,首先計算得到輔助變量的總體均值,然后利用樣本得到的主要變量和輔助變量的樣本均值為,則利用聯(lián)合比估計得到的的估計值為。 在計算分別比估計和聯(lián)合比估計的偏差,這里的方法是利用所有可能的樣本,然后計算出比估計和聯(lián)合估計的估計值,按照與上面相同的計算方法,計算得到其他樣本時比估計和聯(lián)合估計值(按照上面的樣本的排列順序)為: 分別計算可得,而且可以計算得到,。總體的實際均值為。則分別比估計和聯(lián)合比估
20、計的偏差分別為 。 ,所以聯(lián)合比估計的偏差比分別比估計的偏差要小。 接下來計算分別比估計和聯(lián)合比估計的均方誤差。在這里樣本量很小,不可以利用教材中的近似公式。 (3)從分別比估計和聯(lián)合比估計的偏差和均方誤差可以看出,聯(lián)合比估計的偏差和均方誤差都要小于分別比估計,也就是說在本題中,聯(lián)合比估計要比分別估計好。在本題中,各層的比率和總體的比率相差基本差不多,從整個樣本出發(fā)進行的聯(lián)合比估計比基于每層的分別比估計更好一些,偏差更小,均方誤差也更小。 第4章 4.1解:由題意知,平均每戶家庭的訂報份數(shù)為: (份) 總的訂報份數(shù)為: (份) =0.358 333 所以估計方
21、差為: =0.008 869 =141 900 4.2解: 單位 總?cè)藬?shù) 贊成人數(shù) 贊成比例 1 51 42 0.823 529 2 62 53 0.854 839 3 49 40 0.816 327 4 73 45 0.616 438 5 101 63 0.623 762 6 48 31 0.645 833 7 65 38 0.584 615 8 49 30 0.612 245 9 73 54 0.739 726 10 61 45 0.737 705 11 58 51 0.879 31 1
22、2 52 29 0.557 692 13 65 46 0.707 692 14 49 37 0.755 102 15 55 42 0.763 636 (1) =60.733 33 所以該系統(tǒng)同意這一改革人數(shù)的比例為: =70.91% 其估計的方差為: =0.001 37 所以其估計的標(biāo)準(zhǔn)誤為: =3.7% (2) =8% =0.006 4 得n=6.2,所以應(yīng)抽取7個單位作樣本。 4.3解:該集團辦公費用總支出額為: =48/10(83+62+…+67+80)=3 532.8(百元) =72 765.44 =269.
23、750 7(百元) 所以其置信度為95%的置信區(qū)間為:[3 004.089 , 4 061.511] 4.4解:=52.3 所以整個林區(qū)樹的平均高度為: =5.9(米) 其估計的方差為: =0.06 所以其估計的標(biāo)準(zhǔn)誤為: =0.246(米) 其95%的置信區(qū)間為:[5.42 ,6.38] 4.5解:拍攝過藝術(shù)照的女生比例為: =9/30=30% 其估計的方差為: =0.005 891 其估計的標(biāo)準(zhǔn)差為: =7.68% 4.6 解: 其中, 所以最優(yōu)的樣本學(xué)生數(shù)為2。 代入得到 所以最優(yōu)的樣本宿舍數(shù)為20。 4.7解:(1)簡單估計: 居民
24、總的鍛煉時間為: =1 650 居民平均每天用于鍛煉的時間為: =3.3(即33分鐘) =0.163 421 其估計的標(biāo)準(zhǔn)差為: =0.404 254 (2)比率估計: 居民總的鍛煉時間為: 居民平均每天用于鍛煉的時間為: =3.95(即39.5分鐘) =0.071 509 其估計的標(biāo)準(zhǔn)差為: =0.267 411 (3)簡單估計下的相對誤差為: r=0.404 254/3.3=12.25% 比估計下的相對誤差為: r=0.267 411/3.95=6.77% 所以比估計的估計效果好。 第5章 5.1解:(
25、1)代碼法列出下表: PUS Zi Zi 1 000 000 累計 Zi 1 000 000 代碼 1 0.000 110 110 110 1~110 2 0.018 556 18 556 18 666 111~18 666 3 0.062 999 62 999 81 665 18 667~81 665 4 0.078 216 78 216 159 881 81 666~159 881 5 0.075 245 75 245 235 126 159 882~235 126 6 0.073 983 73 983 309 109
26、 235 127~309 109 7 0.076 580 76 580 385 689 309 110~385 689 8 0.038 981 38 981 424670 385 690~424 670 9 0.040 772 40 772 465 442 424 671~465 442 10 0.022 876 22 876 488 318 465 443~488 318 11 0.003 721 3 721 492 039 488 319~492 039 12 0.024 971 24 971 517 010 492 040~51
27、7 010 13 0.040 654 40 654 557 664 517 011~557 664 14 0.014 804 14 804 572 468 557 665~572 468 15 0.005 577 5 577 578 045 572 469~578 045 16 0.070 784 70 784 648 829 578 046~648 829 17 0.069 635 69 635 718 464 648 830~718 464 18 0.034 650 34 650 753 114 718 465~753 114
28、19 0.069 492 69 492 822 606 753 115~822 606 20 0.036 590 36 590 859 196 822 607~859 196 21 0.033 853 33 853 893 049 859 197~893 049 22 0.016 959 16 959 910 008 893 050~910 008 23 0.009 066 9 066 919 074 910 009~919 074 24 0.021 795 21 795 940 869 919 075~940 869 25 0.0
29、59 185 59 185 1 000 054 940 870~1 000 054 表中,Zi不是整數(shù),乘以1 000 000使其變?yōu)檎麛?shù),這樣就可以賦予每個單元與其相等的代碼數(shù)。 先在[1,1 000 054]中產(chǎn)生第一個隨機數(shù)為825 011,其對應(yīng)的單元為20號,則得到第一個入樣單元20; 把單元20去掉,剩余的24個單元,累計代碼數(shù)為1 000 054-36 590=963 464,在[1,963464]中產(chǎn)生第二個隨機數(shù)為456 731,得到第二個入樣單元9; 再把單元9去掉,剩余的23個單元,累計代碼數(shù)為963 464-40 772=922 692,在[1, 922
30、 692]中產(chǎn)生第三個隨機數(shù)為857 190,得到第三個入樣單元24; 依此類推,直至抽出所需的樣本。 最后抽得的10個入樣單元為20,9,24,3,4,25,21,16,7,5。 (2)“拉希里法”。 令,,在[1,25]和[1, 0.078 216]中分別產(chǎn)生隨機數(shù),,第6號單元入樣; 把單元6去掉,剩余的24個單元,仍舊等于0.078 216,在[1,24]和[1, 0.078 216]中分別產(chǎn)生隨機數(shù),,第10號單元不入樣,重新抽取隨機數(shù); 依此類推,直至抽出所需的樣本。 最后抽得的10個入樣單元為6,9,18,4,1,5,19,21,16,13。 5.2.解:首先
31、計算出各PSU單元的入樣概率,。 PSU 1 5 0.2 3,5,4,6,2 20 2 4 0.16 7,4,7,7 25 3 8 0.32 7,2,9,4,5,3,2,6 38 4 5 0.2 2,5,3,6,8 24 5 3 0.12 9,7,5 21 由 可得所有可能樣本的: 樣本 1,2 0.068 091 128.125 1,3 0.192 926 109.375 1,4 0.090 434 110 1,5 0.048 549 137.5 2,3 0.147 531 137.
32、5 2,4 0.068 091 138.125 2,5 0.036 286 165.625 3,4 0.192 926 119.375 3,5 0.106 617 146.875 4,5 0.048 549 147.5 霍維茨-湯普森估計量的方差為。 5.3解:代碼法列出下表: i Zi Zi 1 000 累計Zi 1 000 代碼 1 0.104 104 104 1~104 2 0.192 192 296 105~296 3 0.138 138 434 297~434 4 0.062 62 496 435~
33、496 5 0.052 52 548 497~548 6 0.147 147 695 549~695 7 0.089 89 784 696~784 8 0.038 38 822 785~822 9 0.057 57 879 823~879 10 0.121 121 1 000 880~1 000 表中,Zi不是整數(shù),乘以1 000使其變?yōu)檎麛?shù),這樣就可以賦予每個單元與其相等的代碼數(shù)。 在[1,1 000]之間產(chǎn)生三個隨機數(shù)659,722,498,則它們所對應(yīng)的第6,7,5號單元被抽中,即得到的n=3的PPS樣本包括單元6、單元7和
34、單元5。 5.4解:由題意知n=3, 總體總量的估計為: 總量估計的標(biāo)準(zhǔn)差為: 5.5解:由題意知,,,每個單元的入樣概率。 1 2 0.086 956 52 0.173 913 2 9 0.391 304 35 0.782 609 3 3 0.130 434 78 0.260 87 4 2 0.086 956 52 0.173 913 5 1 0.043 478 26 0.086 957 6 6 0.260 869 57 0.521 739 所有可能的樣本及每對單元入樣概率為: 樣本 1,2 0.1
35、04 607 65.805 56 1,3 0.015 383 86.25 1,4 0.009 686 63.25 1,5 0.004 612 109.25 1,6 0.039 624 82.41 667 2,3 0.160 757 71.555 56 2,4 0.104 607 48.555 56 2,5 0.051 266 94.555 56 2,6 0.361 371 67.722 22 3,4 0.015 383 69 3,5 0.007 346 115 3,6 0.062 88.166 67 4,5 0.004 6
36、12 92 4,6 0.039 624 65.166 67 5,6 0.019 12 111.166 7 以實例驗證式(5.5)、式(5.6): 設(shè)分別為7,20,12,4,6,22,當(dāng)入樣單元為單元1和單元2時,由式(5.5)可得。若由式(5.30)進行計算,有。 二者的計算結(jié)果是一致的。當(dāng)入樣單元為其他情況時,計算過程同上,二者結(jié)果仍保持一致,從而驗證了式(5.5)。 由式(5.6)可得。若直接進行計算,有。 二者計算結(jié)果不一致,可見式(5.6)不適用于π抽樣的情況。 5.6 解:(1) 簡單隨機抽樣簡單估計量為:10,9,5,2,4。 均方誤差為:
37、(2) 簡單隨機抽樣比估計為: ①聯(lián)合比估計: 聯(lián)合比估計估計量為:,因此 均方誤差為: ②分別比估計: 分別比估計估計量為:12.453 33,8.895 238,5.337 143,1.779 048,3.558 095,因此, 均方誤差為: (3)pps抽樣。 10 7 0.388 889 9 5 0.277 778 5 3 0.166 667 2 1 0.055 556 4 2 0.111 111 PPS抽樣漢森-赫維茨估計量:5.142 857,6.48,6,7.2,7.2,因此 均方誤差為: 通過
38、以上計算可以看出,PPS抽樣漢森-赫維茨估計量的均方誤差最??;其次是簡單估計量的均方誤差;兩種比估計的均方誤差相差不大,但都要大于漢森-赫維茨和簡單估計量的均方誤差。 5.7解:設(shè)5個部門的職工總?cè)藬?shù)為150。 由題意得:,,,,由于該樣本為自加權(quán)的,則 由于,,估計的方差為: 估計的標(biāo)準(zhǔn)差為: 則該公司職工上班交通平均所需的時間為34分鐘,估計的標(biāo)準(zhǔn)差為6分鐘。 5.8解:由題意得:,。首先計算出抽中的10個單位的概率:。 單位編號 車輛數(shù) 單位運量總和 平均每車運量 1 5 0.026 882 14 230 2 846 2 8 0.043
39、 011 21 336 2 667 3 5 0.026 882 13 650 2 730 4 4 0.021 505 11 568 2 892 5 6 0.032 258 15 216 2 536 6 9 0.048 387 23 049 2 566 7 5 0.026 882 13 650 2 730 8 3 0.016 129 7 443 2 481 9 7 0.037 634 16 723 2 389 10 3 0.016 129 8 391 2 797 根據(jù)漢森-赫維茨估計量的計算公式可得 即全
40、集團的季度總運量為495 299.4噸。 方差估計量的估計為: 其95%的置信區(qū)間為: 。 第6章 6.1 解:(1)系統(tǒng)抽樣設(shè)計原理:見教材第164頁定義6.1。 (2)系統(tǒng)抽樣與整群抽樣、分層抽樣的關(guān)系: 系統(tǒng)抽樣按行來看,可看作一種特殊的整群抽樣;將每一行的單元視為群,則總體由k個群組成,每個群的大小都是n,即系統(tǒng)抽樣可看作從k個群中隨機抽取1個群的特殊整群抽樣。 系統(tǒng)抽樣按列來看,可看作一種特殊的分層抽樣;將每一列單元視為一層,則總體由n個層組成,每個層的大小都是k,則系統(tǒng)抽樣可看作從n個層中隨機抽取一個單元的特殊分層抽樣。 6.2解:見教材第170頁定理6.2
41、的證明。 6.3解:將40個人依次編號為1~40號,且將這些編號看成首尾相接的一個環(huán)。 已知總體容量N=40,樣本量n=7。由于N/n=5.7,取最接近5.7的整數(shù)6,則抽樣間距k=6。 由于隨機起點r=5,則其余樣本點依次為11,17,23,29,35,1。 因此,用循環(huán)等距抽樣方法抽出的樣本單元序號為5,11,17,23,29,35,1。 6.4解: 對于總體,容量N=360,漢族住戶總數(shù)A=81,漢族比重P=A/N=0.225。 對于樣本,抽樣間距k=8,樣本量n=N/k=45。 簡單隨機抽樣: 系統(tǒng)抽樣: 則。 其中 “系統(tǒng)樣本” 隨機起點號碼r “系統(tǒng)樣本
42、” 的單元組成 “系統(tǒng)樣本”中 漢族住戶總數(shù) “系統(tǒng)樣本”中漢族住戶比例 1 2 3 4 5 6 7 8 略(樣本量45) 7 13 10 10 12 9 10 10 7/45 13/45 10/45 10/45 12/45 9/45 10/45 10/45 6.5解:(1)估計漢族所占比例,采用等距抽樣效果最好。 理由:系統(tǒng)抽樣可看作一種特殊的整群抽樣,則希望系統(tǒng)抽樣抽取的樣本能更好地體現(xiàn)總體性質(zhì)。由于三個民族的居民居住地緊鄰,采取等距抽樣能使樣本中三個民族的分布與總體分布類似,即差異較小。若采用簡單隨機抽樣,可能出現(xiàn)的情況是,抽
43、取的樣本中有過多的漢族居民,而等距抽樣會避免該現(xiàn)象的發(fā)生。 (2)估計男性所占比例,采用簡單隨機抽樣效果最好。 理由:由題意知,每戶人口登記順序為:丈夫、妻子、孩子、其他人,且平均每戶有5口人。若采取等距抽樣,由于抽樣間距k=5,若隨機起點號碼為1,則第一戶抽取丈夫,第二胡抽取丈夫的可能性較大,依此類推,抽取的樣本中,丈夫所占的比重較大,估計時誤差會很大。而簡單隨機抽樣會避免該情況的發(fā)生。 (3)估計孩子所占比例,理由同(2)。 6.6解:(1)估計男性所占比例。 已知總體容量N=50,男性總數(shù)A=24,男性所占比例P=A/N=0.48。 抽樣間距k=5,
44、樣本量n=N/k=10。 簡單隨機抽樣: 系統(tǒng)抽樣: 則。 其中 “系統(tǒng)樣本” 隨機起點號碼r “系統(tǒng)樣本”的單元組成 “系統(tǒng)樣本” 中男性總數(shù) “系統(tǒng)樣本” 中男性比例 1 2 3 4 5 M M M F f M F F f M F F F M M F m m M F f f m F F f f M F f m m f m f f m F f M f f M m m M M m m F 5 5 2 5 7 0.5 0.5 0.2 0.5 0.7
45、 (2)估計孩子所占比例。 已知總體容量N=50,孩子總數(shù)A=24,孩子所占比例P=A/N=0.48。 簡單隨機抽樣: 系統(tǒng)抽樣: 則。 (3)估計職業(yè)住戶中人員所占比例。 已知總體容量N=50,職業(yè)住戶總數(shù)A=19,職業(yè)住戶所占比例P=A/N=0.38。 簡單隨機抽樣: 系統(tǒng)抽樣: 則。 6.7解:已知總體容量N=15,總體均值。 樣本量n=3,抽樣間距k=N/n=5。 簡單隨機抽樣: 系統(tǒng)抽樣: 其中 “系
46、統(tǒng)樣本” 隨機起點號碼r “系統(tǒng)樣本” 的單元組成 “系統(tǒng)樣本” 樣本均值 1 2 3 4 5 1,6,11 2,7,12 3,8,13 4,9,14 5,10,15 6 7 8 9 10 6.8解:書稿平均錯字?jǐn)?shù) 抽樣方差的估計如下: (1)合并層方法估計抽樣方差為: (2)連續(xù)差方法估計抽樣方差為: (3)交叉子樣本方法估計抽樣方差為: 第7章 7.1解:根據(jù)表中數(shù)據(jù),可計算各層的權(quán)重: =0.17, =0.25, =0.28, =0.22, =0.08 全縣棉花的種植面積為: =0.1790/17+0.251 806
47、/25 +0.284 423/28+0.225 607/22+0.084 101/8 =164.27 根據(jù)式(7.4), 的抽樣方差為: =14.578 5+25.141 46 =39.719 96 所以全縣棉花種植面積的抽樣標(biāo)準(zhǔn)誤的估計為: 12 604.75 7.2 解:(1) 由題意知 ,,,,, 根據(jù)公式(7.10)有 根據(jù)公式(7.8),有 ≈ ≈0.000 667 (2)調(diào)查總費用為3 000元,每一個抽樣單元的調(diào)查費用為10元,采用簡單隨機抽樣,樣本量可以達到300,估計量的方差為: 則有 由此可知二重
48、抽樣效率更高。 7.3 解:由題知=602,由表內(nèi)數(shù)據(jù)計算得 =568.583 3 ,=568.25,1.000 587,=256 154.9 ,=278 836.9 ,=256 262 根據(jù)式(7.11),該地區(qū)當(dāng)年平均每村牛的年末頭數(shù)為: 602(頭) 所以該地區(qū)年末牛的總頭數(shù)為: 745 713(頭) 根據(jù)式(7.15), 的方差估計為: 所以該地區(qū)年末牛的總頭數(shù)估計的標(biāo)準(zhǔn)差為: 46 398(頭) 7.4 解:(1)根據(jù)公式(7.10),有 根據(jù)公式(7.8),有 即二重抽樣的樣本最優(yōu)分配方案是第一層分配63個樣本,第二層分配31個樣
49、本。 (2) 令c1/c2h=a,則c1/= c2h=a,若二重抽樣的精度高于簡單隨機抽樣,則有 7.5解:由題意知: n1=300, n2=200, m=62,該保護區(qū)現(xiàn)有羚羊總數(shù)為: (頭) 其抽樣的標(biāo)準(zhǔn)誤為: (頭) 7.6 解:(1)由題意知: n1=7, n2=12, m=4,該地區(qū)漁民總數(shù)為: (人) 其抽樣的標(biāo)準(zhǔn)誤為: (人) 其95%的置信區(qū)間為: =[12,28] (2) 由題意知: n1=16, n2=19, m=11,該地區(qū)漁民總數(shù)為: (人) 其抽樣的標(biāo)準(zhǔn)誤為: (人) 其95%的置信區(qū)間為: =
50、[22,34] (3)計算這些估計時的前提假設(shè): ①總體是封閉的——兩次抽樣間沒有漁民進入或離開該地區(qū),即對每次抽樣而言,N是相同的。 這要求漁民在兩次抽樣間不能離開該地區(qū),其他漁民也不能進入,但這在實際中是很難做到的。 ②每個樣本都是來自總體的簡單隨機抽樣,即該地區(qū)每個漁民都有同樣的機會被找到。在實際中由于漁民所在地和作業(yè)時間的不同,不可能每一個漁民在調(diào)查時都能被找到,比如某些住在偏僻位置的漁民被找到的機會就會小些。 ③兩個樣本是獨立的,即漁民第一次被找到的概率跟第二次能否被找到的概率沒有關(guān)系。 ④不會丟失第一次被找到的漁民資料,即第一次被找到的漁民,在第二次被找到時可識別。
51、 ⑤近似服從正態(tài)分布。 7.7 解:(1)如果NCRSR和BDMP登記體系是兩個獨立的系統(tǒng),也就是兩個系統(tǒng)在登記病人時是獨立進行的,病人出現(xiàn)在NCRSR中的概率與出現(xiàn)在BDMP中的概率無關(guān),那么作者的認識就是正確的。 第一,滿足總體是封閉的假設(shè), NCRSR和BDMP登記系統(tǒng)都是針對全國人口進行登記,而且是在同一段時間范圍內(nèi)進行,因此總體單元數(shù)是一樣的。 第二,滿足標(biāo)識不丟失的假設(shè),先天性風(fēng)疹綜合征在出生時就會被確定出,不會因為以后是否恢復(fù)而被更改。 第三,可能不滿足每個樣本都是來自總體的簡單隨機樣本。簡單隨機樣本要求每個樣本入樣概率相同,從全國范圍看,這一假設(shè)不一定能滿足。比如由于抽
52、樣框的原因,偏遠地區(qū)或者欠發(fā)達地區(qū)的人群被登記的概率會低于中心地區(qū)或者發(fā)達地區(qū)。 (2)由公式(7.21)得每年的如下表: 年份 NCRSR(n1) BDMP(n2) 兩者均有(m) 1970 45 15 2 244 1971 23 3 0 95 1972 20 6 2 48 1973 22 13 3 80 1974 12 6 1 45 1975 22 9 1 114 1976 15 7 2 42 1977 13 8 3 31 1978 18 9 2 62 1979 39 11 2
53、 159 1980 12 4 1 32 1981 4 0 0 4 1982 11 2 0 35 1983 3 0 0 3 1984 3 0 0 3 1985 1 0 0 1 (3)累計所有年份的數(shù)據(jù),得到n10=263, n20=93, m0=19,由公式(7.21)得到1970—1985年間先天性風(fēng)疹綜合征的總病例數(shù)為: (人) 累計(2)的估計結(jié)果得到1970—1985年間先天性風(fēng)疹綜合征的總病例數(shù)為998人。 從結(jié)果上看,我們認為(3)的計算結(jié)果更可信,因為(3)的樣本量足夠大。 (4)直觀上由下圖發(fā)現(xiàn)先天性風(fēng)疹綜合
54、征的患病人數(shù)是在下降。 第8章 8.13 解:(1)原假設(shè):患有婦科疾病與是否遭受配偶性虐待相互獨立。在原假設(shè)成立條件下,各單元格的期望頻數(shù)為: (2) 如果顯著性水平,拒絕原假設(shè),即認為婦科疾病與是否遭受配偶性虐待不獨立。 (3)應(yīng)用傳統(tǒng)的卡方檢驗方法的前提是樣本中各觀測值的權(quán)數(shù)相等。本題中樣本由于存在無回答情形,各觀測值的權(quán)數(shù)不一定相等,因此傳統(tǒng)的卡方檢驗方法不合適。 8.14解:設(shè)總體相關(guān)系數(shù)為,其中,為總體標(biāo)準(zhǔn)差。 又 所以 (2) ,這里。 (3) 第
55、9章 9.1 解:首先計算每套子樣本中的居民家庭平均年總收入,結(jié)果如下表所示: 子樣本 1 2 3 4 5 平均收入 17.8 18.7 19.3 19 19 用(=1,2,3,4,5)表示每套子樣本中的居民家庭平均年總收入,則 =18.76 從而 =0.066 6 的95%置信區(qū)間為: 9.2 解:要估計的比率是,其中,X和Y分別是該地區(qū)的勞動人口數(shù)和失業(yè)人數(shù)。由于每層的權(quán)重一樣,故R的估計為: =359/3 643=0.09 854 516 現(xiàn)采用刀切法估計失業(yè)率的方差,將每個層視為一組,從而有 ==271/2 681=0.1 01
56、0 817 ==259/2 691=0.09 624 675 ==276/2 777=0.09 938 783 ==271/2 780=0.09 748 201 因此有 0.090 936 0.105 44 0.096 017 0.101 735 根據(jù)刀切法,估計該區(qū)的人口出生率為: 0.098 532 的刀切法方差估計為: = = == 9.3解:要估計的比率是,其中,x和y分別是該區(qū)的人口數(shù)和新生嬰兒數(shù)。由于每個初級抽樣單元的大小相等,且第二階段抽取的樣本量也一樣。因而,R的估計為: = =0.009 723 187 現(xiàn)采用刀切法估計人口出生率的方
57、差。將每個街道中的所有居委會視為一組,從而有 ==0.009 675 282 ==0.010 060 1 ==0.009 425 196 ==0.009 726 849 因此有 0.009 867 0.008 712 0.010 617 0.009 712 根據(jù)刀切法,估計該區(qū)的人口出生率為: 0.009 727 的刀切法方差估計為: = = == 第10章 10.6解:該總體真實均值為 (1)對于一個在60%層中抽樣的方法: bias=40.7-46.08=-5.38 (2)當(dāng)回答率為60%時,由(1)有 即均方誤差的根不可能達到
58、5%。 當(dāng)回答率為80%時 bias=43.5-46.08=-5.38 當(dāng)回答率高于80%時 | bias |<2.58 而對于所有的回答率方法均有 因而當(dāng)采用80%或更高回答率時 只要當(dāng)n稍稍大于100,便有 (3)采用90%方法時 bias=44.8-46.08=-1.28 得n=1 047 采用95%方法時 bias=45.4-46.08=-0.68 得n=701 10.7解:由上題(3)知,當(dāng)回答率為90%時n=1 047,則 總費用=51 047=5 235 當(dāng)回答率為95%時,n=701,則 總費用= 53 / 54下載文檔可編輯
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《晏子使楚》優(yōu)秀課件 (3)
- 科室醫(yī)院年終總結(jié)課件
- 常用邏輯用語章末總結(jié)課件(人教A版選修1-1)免
- 新版PEP四年級英語上冊Unit3-My-Friends-B-Let’s-learn完美版-PPT
- 金融科技機遇
- 抗菌藥物合理使用專家講座
- 阿奇霉素在臨床中的應(yīng)用專家講座
- 納米抗菌蠶絲被介紹
- 男性盆部和會陰斷層解剖研究
- 部編選擇性必修二經(jīng)濟與社會生活-第九課世紀(jì)以來人類的經(jīng)濟與生活教學(xué)課件
- 春七年級數(shù)學(xué)下冊 82 整式乘法單項式與單項式相乘課件4 (新版)滬科版
- 部編人教版語文七年級下冊7.土地的誓言課件
- 手足口病
- 正壓通氣裝置課件
- 課件】食品分析與檢驗技術(shù)第二章