《《抽樣技術(shù)》習(xí)題答案(總12頁)》由會員分享,可在線閱讀,更多相關(guān)《《抽樣技術(shù)》習(xí)題答案(總12頁)(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第2章
解:
項目
相同之處
不同之處
定義
都是根據(jù)從一個總體中抽樣得到的樣本,然后定義樣本均值為。
抽樣理論中樣本是從有限總體中按放回的抽樣方法得到的,樣本中的樣本點不會重復(fù);而數(shù)理統(tǒng)計中的樣本是從無限總體中利用有放回的抽樣方法得到的,樣本點有可能是重復(fù)的。
性質(zhì)
(1) 樣本均值的期望都等于總體均值,也就是抽樣理論和數(shù)理統(tǒng)計中的樣本均值都是無偏估計。
(2) 不論總體原來是何種分布,在樣本量足夠大的條件下,樣本均值近似服從正態(tài)分布。
(1) 抽樣理論中,各個樣本之間是不獨立的;而數(shù)理統(tǒng)計中的各個樣本之間是相互獨立的。
(2) 抽
2、樣理論中的樣本均值的方差為,其中。在數(shù)理統(tǒng)計中,,其中為總體的方差。
解:首先估計該市居民日用電量的95%的置信區(qū)間。根據(jù)中心極限定理可知,在大樣本的條件下,近似服從標準正態(tài)分布, 的的置信區(qū)間為。
而中總體的方差是未知的,用樣本方差來代替,置信區(qū)間為
由題意知道,,而且樣本量為,代入可以求得
。將它們代入上面的式子可得該市居民日用電量的95%置信區(qū)間為。
下一步計算樣本量。絕對誤差限和相對誤差限的關(guān)系為。
根據(jù)置信區(qū)間的求解方法可知
根據(jù)正態(tài)分布的分位數(shù)可以知道,所以。也就是。
把代入上式可得,。所以樣本量至少為862。
解:總體中參加培訓(xùn)班的比例為,那么
3、這次簡單隨機抽樣得到的的估計值的方差,利用中心極限定理可得在大樣本的條件下近似服從標準正態(tài)分布。在本題中,樣本量足夠大,從而可得的的置信區(qū)間為。
而這里的是未知的,我們使用它的估計值。所以總體比例的的置信區(qū)間可以寫為,將代入可得置信區(qū)間為。
解:利用得到的樣本,計算得到樣本均值為,從而估計小區(qū)的平均文化支出為144.5元。總體均值的的置信區(qū)間為,用來估計樣本均值的方差。
計算得到,則,,代入數(shù)值后計算可得總體均值的95%的置信區(qū)間為。
解:根據(jù)樣本信息估計可得每個鄉(xiāng)的平均產(chǎn)量為1 120噸,該地區(qū)今年的糧食總產(chǎn)量的估計值為(噸)。
總體總值估計值的方差為,總體總值的的置信區(qū)間為,
4、把
代入,可得糧食總產(chǎn)量的的置信區(qū)間為。
解:首先計算簡單隨機抽樣條件下所需要的樣本量,把帶入公式,最后可得。
如果考慮到有效回答率的問題,在有效回答率為70%時,樣本量應(yīng)該最終確定為。
解:去年的化肥總產(chǎn)量和今年的總產(chǎn)量之間存在較強的相關(guān)性,而且這種相關(guān)關(guān)系較為穩(wěn)定,所以引入去年的化肥產(chǎn)量作為輔助變量。于是我們采用比率估計量的形式來估計今年的化肥總產(chǎn)量。去年化肥總產(chǎn)量為。利用去年的化肥總產(chǎn)量,今年的化肥總產(chǎn)量的估計值為噸。
解:本題中,簡單估計量的方差的估計值為=37.17。
利用比率估計量進行估計時,我們引入了家庭的總支出作為輔助變量,記為。文化支出屬于總支出的一部分,這
5、個主要變量與輔助變量之間存在較強的相關(guān)關(guān)系,而且它們之間的關(guān)系是比較穩(wěn)定的,且全部家庭的總支出是已知的量。
文化支出的比率估計量為,通過計算得到,而,則,文化支出的比率估計量的值為(元)。
現(xiàn)在考慮比率估計量的方差,在樣本量較大的條件下,,通過計算可以得到兩個變量的樣本方差為,之間的相關(guān)系數(shù)的估計值為,代入上面的公式,可以得到比率估計量的方差的估計值為。這個數(shù)值比簡單估計量的方差估計值要小很多。全部家庭的平均文化支出的的置信區(qū)間為,把具體的數(shù)值代入可得置信區(qū)間為。
接下來比較比估計和簡單估計的效率,,這是比估計的設(shè)計效應(yīng)值,從這里可以看出比估計量比簡單估計量的效率更高。
解:利用
6、簡單估計量可得,樣本方差為,,樣本均值的方差估計值為。
利用回歸估計的方法,在這里選取肉牛的原重量為輔助變量。選擇原重量為輔助變量是合理的,因為肉牛的原重量在很大程度上影響著肉牛的現(xiàn)在的重量,二者之間存在較強的相關(guān)性,相關(guān)系數(shù)的估計值為,而且這種相關(guān)關(guān)系是穩(wěn)定的,這里肉牛的原重量的數(shù)值已經(jīng)得到,所以選擇肉牛的原重量為輔助變量。
回歸估計量的精度最高的回歸系數(shù)的估計值為。現(xiàn)在可以得到肉?,F(xiàn)重量的回歸估計量為,代入數(shù)值可以得到。
回歸估計量的方差為,方差的估計值為,代入相應(yīng)的數(shù)值, ,顯然有。在本題中,因為存在肉牛原重量這個較好的輔助變量,所以回歸估計量的精度要好于簡單估計量。
第3章
7、
3.3 解:(1) 首先計算出每層的簡單估計量,分別為,其中,,則每個層的層權(quán)分別為;
則利用分層隨機抽樣得到該小區(qū)居民購買彩票的平均支出的估計量,代入數(shù)值可以得到。
購買彩票的平均支出的的估計值的方差為,此方差的估計值為,根據(jù)數(shù)據(jù)計算可以得到每層的樣本方差分別為:
其中,代入數(shù)值可以求得方差的估計值為,則估計的標準差為。
(2)由區(qū)間估計可知相對誤差限滿足
所以,。
樣本均值的方差為,(提1/n出去)從而可以得到在置信度為,相對誤差限為條件下的樣本量為。
①對于比例分配而言,有成立,那么,把相應(yīng)的估計值和數(shù)值代入后可以計算得到樣本量為,相應(yīng)的在各層的樣本量分別為
8、。
②按照內(nèi)曼分配時,樣本量在各層的分配滿足,這時樣本量的計算公式變?yōu)?,把相?yīng)的數(shù)值代入后可得,在各層中的分配情況如下:。
3.5 解:總體總共分為10個層,每個層中的樣本均值已經(jīng)知道,層權(quán)也得到,從而可以計算得到該開發(fā)區(qū)居民購買冷凍食品的平均支出的估計值為。
下一步計算平均支出的95%的置信區(qū)間,首先計算購買冷凍食品的平均支出的估計值的方差,其中,但是每層的方差是未知,則樣本平均支出的方差的估計值為,每個層的樣本標準差已知,題目中已經(jīng)注明各層的抽樣比可以忽略,計算可以得到。則這個開發(fā)區(qū)的居民購買冷凍食品的平均支出置信區(qū)間為
代入數(shù)值后,可得最終的置信區(qū)間為。
3.6 解:首先
9、計算簡單隨機抽樣的方差,根據(jù)各層的層權(quán)和各層的總體比例可以得到總體的比例為,則樣本量為100的簡單隨機樣本的樣本比例的方差為
,不考慮有限總體校正系數(shù),,其中,
在的條件下,通過簡單隨機抽樣得到的樣本比例的方差為
通過分層抽樣得到的樣本比例的方差為,但是因為不考慮有
限總體校正系數(shù),而且抽樣方式是比例抽樣,所以有成立,樣本比例的方差近似為。對于每一層,分別有,在的條件下,近似的有成立,有
樣本量應(yīng)該滿足,同時這里要求分層隨機抽樣得到的估計的方差和簡單抽
樣的方差是相同的,,層權(quán)分別為,代入數(shù)值,可以計算得到最終的樣本量為。
第4章
4.1解:由題
10、意知,平均每戶家庭的訂報份數(shù)為:M=3,n=10
(份)
總的訂報份數(shù)為:
(份)
=0.358 333
所以估計方差為:
=0.008 869
=141 900
4.3解:該集團辦公費用總支出額為:
=48/10(83+62+…+67+80)=3 532.8(百元)
=72 765.44
=269.750 7(百元)
所以其置信度為95%的置信區(qū)間為:[3 004.089 , 4 061.511]
4.4解:=52.3
所以整個林區(qū)樹的平均高度為:
=5.9(米)更正除以n
其估計的方差為:
=0.06
所以其估計的標準誤為:
=0.246(米)
11、
其95%的置信區(qū)間為:[5.42 ,6.38]
5.6 解:(1) 簡單隨機抽樣簡單估計量為:10,9,5,2,4。
均方誤差為:
(2) 簡單隨機抽樣比估計為:
①聯(lián)合比估計:
聯(lián)合比估計估計量為:,因此
均方誤差為:
②分別比估計:
分別比估計估計量為:12.453 33,8.895 238,5.337 143,1.779 048,3.558 095,因此,
均方誤差為:
(3)pps抽樣。
10
7
0.388 889
9
5
0.277 778
5
3
0.166 667
2
1
0.055 5
12、56
4
2
0.111 111
PPS抽樣漢森-赫維茨估計量:5.142 857,6.48,6,7.2,7.2,因此
均方誤差為:
通過以上計算可以看出,PPS抽樣漢森-赫維茨估計量的均方誤差最?。黄浯问呛唵喂烙嬃康木秸`差;兩種比估計的均方誤差相差不大,但都要大于漢森-赫維茨和簡單估計量的均方誤差。
根據(jù)漢森-赫維茨估計量的計算公式可得
第6章
6.3解:將40個人依次編號為1~40號,且將這些編號看成首尾相接的一個環(huán)。
已知總體容量N=40,樣本量n=7。由于N/n=5.7,取最接近5.7但不大于的整數(shù)6,則抽樣間距k=5。些時樣本量修改為
13、n=8
由于隨機起點r=5,則其余樣本點依次為10,15,20,25,30,35,40
因此,用循環(huán)等距抽樣方法抽出的樣本單元序號為5,10,15,20,25,30,35,40
6.7解:已知總體容量N=15,總體均值。
樣本量n=3,抽樣間距k=N/n=5。
簡單隨機抽樣:
系統(tǒng)抽樣:
其中
“系統(tǒng)樣本”
隨機起點號碼r
“系統(tǒng)樣本”
的單元組成
“系統(tǒng)樣本”
樣本均值
1
2
3
4
5
1,6,11
2,7,12
3,8,13
4,9,14
5,10,15
6
7
8
9
10
14、
第7章
7.1解:根據(jù)表中數(shù)據(jù),可計算各層的權(quán)重:
=0.17, =0.25, =0.28, =0.22, =0.08
全縣棉花的種植面積為:
=0.1790/17+0.251 806/25
+0.284 423/28+0.225 607/22+0.084 101/8
=164.27
7.3 解:由題知=602,由表內(nèi)數(shù)據(jù)計算得
=568.583 3 ,=568.25,1.000 587,=256 154.9 ,=278 836.9 ,=256 262
根據(jù)式(7.11),該地區(qū)當年平均每村牛的年末頭數(shù)為:
602(頭)
所以該地區(qū)年末牛的總頭數(shù)為:
745 713(頭)
7.5解:由題意知: n1=300, n2=200, m=62,該保護區(qū)現(xiàn)有羚羊總數(shù)為:
(頭)
其抽樣的標準誤為:
(頭)
7.6 解:(1)由題意知: n1=7, n2=12, m=4,該地區(qū)漁民總數(shù)為:
(人)
其抽樣的標準誤為:
(人)
其95%的置信區(qū)間為:
=[12,28]
(2) 由題意知: n1=16, n2=19, m=11,該地區(qū)漁民總數(shù)為:
(人)
其抽樣的標準誤為:
(人)
其95%的置信區(qū)間為:
=[22,34]