《抽樣技術(shù)》第四版習(xí)題答案.doc
《《抽樣技術(shù)》第四版習(xí)題答案.doc》由會員分享,可在線閱讀,更多相關(guān)《《抽樣技術(shù)》第四版習(xí)題答案.doc(38頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第2章 解: 這種抽樣方法是等概率的。在每次抽取樣本單元時,尚未被抽中的編號為1~64的這些單元中每一個單元被抽到的概率都是。 這種抽樣方法不是等概率的。利用這種方法,在每次抽取樣本單元時,尚未被抽中的編號為1~35以及編號為64的這36個單元中每個單元的入樣概率都是,而尚未被抽中的編號為36~63的每個單元的入樣概率都是。 這種抽樣方法是等概率的。在每次抽取樣本單元時,尚未被抽中的編號為20 000~21 000中的每個單元的入樣概率都是,所以這種抽樣是等概率的。 解: 項(xiàng)目 相同之處 不同之處 定義 都是根據(jù)從一個總體中抽樣得到的樣本,然后定義樣本均值為。 抽樣理論中樣本是從有限總體中按放回的抽樣方法得到的,樣本中的樣本點(diǎn)不會重復(fù);而數(shù)理統(tǒng)計(jì)中的樣本是從無限總體中利用有放回的抽樣方法得到的,樣本點(diǎn)有可能是重復(fù)的。 性質(zhì) (1) 樣本均值的期望都等于總體均值,也就是抽樣理論和數(shù)理統(tǒng)計(jì)中的樣本均值都是無偏估計(jì)。 (2) 不論總體原來是何種分布,在樣本量足夠大的條件下,樣本均值近似服從正態(tài)分布。 (1) 抽樣理論中,各個樣本之間是不獨(dú)立的;而數(shù)理統(tǒng)計(jì)中的各個樣本之間是相互獨(dú)立的。 (2) 抽樣理論中的樣本均值的方差為,其中。在數(shù)理統(tǒng)計(jì)中,,其中為總體的方差。 解:首先估計(jì)該市居民日用電量的95%的置信區(qū)間。根據(jù)中心極限定理可知,在大樣本的條件下,近似服從標(biāo)準(zhǔn)正態(tài)分布, 的的置信區(qū)間為。 而中總體的方差是未知的,用樣本方差來代替,置信區(qū)間為。 由題意知道,,而且樣本量為,代入可以求得 。將它們代入上面的式子可得該市居民日用電量的95%置信區(qū)間為。 下一步計(jì)算樣本量。絕對誤差限和相對誤差限的關(guān)系為。 根據(jù)置信區(qū)間的求解方法可知 根據(jù)正態(tài)分布的分位數(shù)可以知道,所以。也就是。 把代入上式可得,。所以樣本量至少為862。 解:總體中參加培訓(xùn)班的比例為,那么這次簡單隨機(jī)抽樣得到的的估計(jì)值的方差,利用中心極限定理可得在大樣本的條件下近似服從標(biāo)準(zhǔn)正態(tài)分布。在本題中,樣本量足夠大,從而可得的的置信區(qū)間為。 而這里的是未知的,我們使用它的估計(jì)值。所以總體比例的的置信區(qū)間可以寫為,將代入可得置信區(qū)間為。 解:利用得到的樣本,計(jì)算得到樣本均值為,從而估計(jì)小區(qū)的平均文化支出為144.5元??傮w均值的的置信區(qū)間為,用來估計(jì)樣本均值的方差。 計(jì)算得到,則,,代入數(shù)值后計(jì)算可得總體均值的95%的置信區(qū)間為。 解:根據(jù)樣本信息估計(jì)可得每個鄉(xiāng)的平均產(chǎn)量為1 120噸,該地區(qū)今年的糧食總產(chǎn)量的估計(jì)值為(噸)。 總體總值估計(jì)值的方差為,總體總值的的置信區(qū)間為,把 代入,可得糧食總產(chǎn)量的的置信區(qū)間為。 解:首先計(jì)算簡單隨機(jī)抽樣條件下所需要的樣本量,把帶入公式,最后可得。 如果考慮到有效回答率的問題,在有效回答率為70%時,樣本量應(yīng)該最終確定為。 解:去年的化肥總產(chǎn)量和今年的總產(chǎn)量之間存在較強(qiáng)的相關(guān)性,而且這種相關(guān)關(guān)系較為穩(wěn)定,所以引入去年的化肥產(chǎn)量作為輔助變量。于是我們采用比率估計(jì)量的形式來估計(jì)今年的化肥總產(chǎn)量。去年化肥總產(chǎn)量為。利用去年的化肥總產(chǎn)量,今年的化肥總產(chǎn)量的估計(jì)值為噸。 解:本題中,簡單估計(jì)量的方差的估計(jì)值為=37.17。 利用比率估計(jì)量進(jìn)行估計(jì)時,我們引入了家庭的總支出作為輔助變量,記為。文化支出屬于總支出的一部分,這個主要變量與輔助變量之間存在較強(qiáng)的相關(guān)關(guān)系,而且它們之間的關(guān)系是比較穩(wěn)定的,且全部家庭的總支出是已知的量。 文化支出的比率估計(jì)量為,通過計(jì)算得到,而,則,文化支出的比率估計(jì)量的值為(元)。 現(xiàn)在考慮比率估計(jì)量的方差,在樣本量較大的條件下,,通過計(jì)算可以得到兩個變量的樣本方差為,之間的相關(guān)系數(shù)的估計(jì)值為,代入上面的公式,可以得到比率估計(jì)量的方差的估計(jì)值為。這個數(shù)值比簡單估計(jì)量的方差估計(jì)值要小很多。全部家庭的平均文化支出的的置信區(qū)間為,把具體的數(shù)值代入可得置信區(qū)間為。 接下來比較比估計(jì)和簡單估計(jì)的效率,,這是比估計(jì)的設(shè)計(jì)效應(yīng)值,從這里可以看出比估計(jì)量比簡單估計(jì)量的效率更高。 解:利用簡單估計(jì)量可得,樣本方差為,,樣本均值的方差估計(jì)值為。 利用回歸估計(jì)的方法,在這里選取肉牛的原重量為輔助變量。選擇原重量為輔助變量是合理的,因?yàn)槿馀5脑亓吭诤艽蟪潭壬嫌绊懼馀5默F(xiàn)在的重量,二者之間存在較強(qiáng)的相關(guān)性,相關(guān)系數(shù)的估計(jì)值為,而且這種相關(guān)關(guān)系是穩(wěn)定的,這里肉牛的原重量的數(shù)值已經(jīng)得到,所以選擇肉牛的原重量為輔助變量。 回歸估計(jì)量的精度最高的回歸系數(shù)的估計(jì)值為?,F(xiàn)在可以得到肉牛現(xiàn)重量的回歸估計(jì)量為,代入數(shù)值可以得到。 回歸估計(jì)量的方差為,方差的估計(jì)值為,代入相應(yīng)的數(shù)值, ,顯然有。在本題中,因?yàn)榇嬖谌馀T亓窟@個較好的輔助變量,所以回歸估計(jì)量的精度要好于簡單估計(jì)量。 第3章 3.1 解:在分層隨機(jī)抽樣中,層標(biāo)志的選擇很重要。劃分層的指標(biāo)應(yīng)該與抽樣調(diào)查中最關(guān)心的調(diào)查變量存在較強(qiáng)的相關(guān)性,而且把總體劃分為幾個層之后,層應(yīng)該滿足:層內(nèi)之間的差異盡可能小,層間差異盡可能大。這樣才能使得最后獲得的樣本有很好的代表性。對幾種分層方法的判斷如下: (1)選擇性別作為分層變量,是不合適的。首先,性別這個變量與研究最關(guān)心的變量(不同職務(wù),職稱的人對分配制度改革的態(tài)度)沒有很大的相關(guān)性;其次,用性別作為分層變量后,層內(nèi)之間的差異仍然很大,相反,層之間的差異不是很大,因?yàn)槟行院团愿髯詢?nèi)部的職務(wù),職稱也存在很大的差別;最后,選擇性別作為分層變量后,需要首先得到男性和女性的抽樣框,這樣會更加麻煩,也會使抽樣會變得更加復(fù)雜。 (2)按照教師、行政管理人員和職工進(jìn)行分層,是合適的。這種分層的指標(biāo)與抽樣調(diào)查研究中最關(guān)心的變量高度相關(guān),而且按照這種方法分層后,可以看出層內(nèi)對于分配制度改革的態(tài)度差異比較小,因?yàn)樗麄儗儆谙嗤碾A層,而層之間的態(tài)度的差異是比較大的。這樣選取出來的樣本具有很好的代表性。 (3)按照職稱(正高、副高、中級、初級和其他)分層,也是合理的。理由與(2)相同,這樣進(jìn)行分層的變量選擇與調(diào)查最關(guān)心的變量是高度相關(guān)的,分層后的層滿足分層的要求。所以,按照職稱進(jìn)行分層是合理的。 (4)按照部門進(jìn)行分層,是合理的。因?yàn)閷W(xué)校有很多院、系或者所,直接進(jìn)行簡單隨機(jī)抽樣,有可能樣本不能很好地代表各個院系,最關(guān)心的變量與部門也存在一定的相關(guān)性。這樣分層后,每個層的總體數(shù)目和抽取的樣本量都較小,最終的樣本的分布比較均勻,比簡單隨機(jī)抽樣更加方便實(shí)施。 3.2 解:設(shè)計(jì)的方案如下: 第一種方案:可以按照不同的專業(yè)進(jìn)行分層,但是考慮到如果在每層都抽取,不能保證每個新生的入樣概率相等,因?yàn)槊總€專業(yè)的人數(shù)比例未知,8個人的樣本量無法在每個層之間進(jìn)行分配。所以采取如下方法:對所有的新生按照專業(yè)的先后順序進(jìn)行編號,使得每個專業(yè)的人的編號在一起,然后隨機(jī)選取出一個號碼,然后選取出這個號碼所在的專業(yè),選取出這個專業(yè),再在這個專業(yè)的所有新生中按照簡單隨機(jī)抽樣的方法選取出8個人。這樣就可以保證每個人入選的概率是相等的。 第二種方案:也可以按照性別進(jìn)行分類,對他們進(jìn)行編號,為1~800,使得男生的編號都在一起,女生的編號也都在一起,然后隨機(jī)選取出一個號碼,然后看這個號碼所對應(yīng)的性別,然后從這個性別的所有人中按照簡單隨機(jī)抽樣的方法選取出8個新生。這樣就可以保證所有的新生的入樣概率是相同的。 第三種方案:隨機(jī)地把所有的人分成8組,而且使得每組的人都是100個人,這樣分組完成后,每個組的新生進(jìn)行編號為1~100,然后隨機(jī)抽取出一個號碼,再從所有的小組中抽取出號碼所對應(yīng)的新生,從而抽取出8個人。 3.3 解:(1) 首先計(jì)算出每層的簡單估計(jì)量,分別為,其中,,則每個層的層權(quán)分別為; 則利用分層隨機(jī)抽樣得到該小區(qū)居民購買彩票的平均支出的估計(jì)量,代入數(shù)值可以得到。 購買彩票的平均支出的的估計(jì)值的方差為,此方差的估計(jì)值為,根據(jù)數(shù)據(jù)計(jì)算可以得到每層的樣本方差分別為: 其中,代入數(shù)值可以求得方差的估計(jì)值為,則估計(jì)的標(biāo)準(zhǔn)差為。 (2)由區(qū)間估計(jì)可知相對誤差限滿足 所以,。 樣本均值的方差為,從而可以得到在置信度為,相對誤差限為條件下的樣本量為。 ①對于比例分配而言,有成立,那么,把相應(yīng)的估計(jì)值和數(shù)值代入后可以計(jì)算得到樣本量為,相應(yīng)的在各層的樣本量分別為。 ②按照內(nèi)曼分配時,樣本量在各層的分配滿足,這時樣本量的計(jì)算公式變?yōu)?,把相?yīng)的數(shù)值代入后可得,在各層中的分配情況如下:。 3.4 解:(1) 首先計(jì)算得到每層中在家吃年夜飯的樣本比例為,那么根據(jù)每一層的層權(quán),計(jì)算得到該市居民在家吃年夜飯的樣本比例為。 每一層中在家吃年夜飯的樣本比例的方差為,則該市居民在家吃年夜飯的比例的方差,在的條件下, ,而其中每層的吃年夜飯的樣本比例的方差的估計(jì)值為,則樣本比例的方差的估計(jì)值為,把相應(yīng)的數(shù)值代入計(jì)算可得方差的估計(jì)值為,從而可以得到該估計(jì)值的標(biāo)準(zhǔn)差為。 (2)利用上題的結(jié)果,,這里的方差是,在的條件下,近似有。 ①比例分配的條件下,有成立,那么,把相應(yīng)的估計(jì)值和數(shù)值代入可以求得最終的樣本量應(yīng)該是,樣本量在各層的分配是,, 。 ②內(nèi)曼分配條件下,,則,代入相應(yīng)的估計(jì)值和數(shù)值可以計(jì)算得到樣本量為,在各層中樣本量的分配為。 3.5 解:總體總共分為10個層,每個層中的樣本均值已經(jīng)知道,層權(quán)也得到,從而可以計(jì)算得到該開發(fā)區(qū)居民購買冷凍食品的平均支出的估計(jì)值為。 下一步計(jì)算平均支出的95%的置信區(qū)間,首先計(jì)算購買冷凍食品的平均支出的估計(jì)值的方差,其中,但是每層的方差是未知,則樣本平均支出的方差的估計(jì)值為,每個層的樣本標(biāo)準(zhǔn)差已知,題目中已經(jīng)注明各層的抽樣比可以忽略,計(jì)算可以得到。則這個開發(fā)區(qū)的居民購買冷凍食品的平均支出置信區(qū)間為 代入數(shù)值后,可得最終的置信區(qū)間為。 3.6 解:首先計(jì)算簡單隨機(jī)抽樣的方差,根據(jù)各層的層權(quán)和各層的總體比例可以得到總體的比例為,則樣本量為100的簡單隨機(jī)樣本的樣本比例的方差為 ,不考慮有限總體校正系數(shù),,其中, 在的條件下,通過簡單隨機(jī)抽樣得到的樣本比例的方差為 通過分層抽樣得到的樣本比例的方差為,但是因?yàn)椴豢紤]有 限總體校正系數(shù),而且抽樣方式是比例抽樣,所以有成立,樣本比例的方差近似為。對于每一層,分別有,在的條件下,近似的有成立,有 樣本量應(yīng)該滿足,同時這里要求分層隨機(jī)抽樣得到的估計(jì)的方差和簡單抽 樣的方差是相同的,,層權(quán)分別為,代入數(shù)值,可以計(jì)算得到最終的樣本量為。 3.7解:事后分層得到的總體均值的估計(jì)量和估計(jì)量的方差分別為 ,估計(jì)量的方差的估計(jì)值 。 對于幾種說法的判斷如下: (1)事后分層比簡單隨機(jī)抽樣產(chǎn)生更加精確的結(jié)果,這個說法是錯誤的。從事后分層得到估計(jì)量的方差的估計(jì)值來看,它的方差不一定比簡單隨機(jī)抽樣的要小,而且從事后分層得到的樣本是利用簡單隨機(jī)抽樣的方法得到的,只是在計(jì)算估計(jì)量和估計(jì)量的方差時是按照分層隨機(jī)抽樣來處理,而且事后分層要求層權(quán)是已知的,但是當(dāng)層權(quán)未知從而利用樣本來估計(jì)層權(quán)時,就會產(chǎn)生偏差,事后分層不見得比簡單隨機(jī)抽樣產(chǎn)生更精確的結(jié)果。 (2)事后分層比按比例分配產(chǎn)生更精確的結(jié)果,這個說法是錯誤的。從事后分層得到的估計(jì)量的方差的估計(jì)值可以看出,它的第一項(xiàng)就是按照比例分層抽樣得到的估計(jì)量方差的估計(jì)值,公式中的第二項(xiàng)表示的是按事后分層時各層樣本量與按照比例分層時各層樣本量發(fā)生偏差所引起的方差的增量。 (3)事后分層的最優(yōu)分配產(chǎn)生更精確的結(jié)果,這種說法是錯誤的。事后分層在樣本量足夠大的條件下是與比例分層相當(dāng)?shù)模窃谝话銞l件下,事后分層的精度仍然低于比例分層的,那么事后分層的精度也會高于最優(yōu)分配的精度。 (4)在抽樣時不能得到分層變量,這個說法是正確的。事后分層在抽樣時,是利用簡單隨機(jī)抽樣的方法,在抽樣時不涉及按照變量進(jìn)行分層,至于按變量進(jìn)行分層,是在抽樣完成后,然后根據(jù)具體的變量來對樣本進(jìn)行分層。 (5)它的估計(jì)量的方差與真正按照比例分層隨機(jī)抽樣的方差差不多,只有在樣本量足夠大的條件下才成立。在樣本量足夠大的條件下,從事后分層的方差的計(jì)算公式可以看出,它的第二項(xiàng)會趨于0,這時事后分層的估計(jì)量的方差和分層隨機(jī)抽樣的方差差不多。 3.8 解:(1) 根據(jù)簡單隨機(jī)抽樣的公式,登記原始憑證的差錯率的估計(jì)值為 ,在考慮到的條件下,登記的原始憑證的差錯率的估計(jì)量的方差近似為 則估計(jì)量的方差的估計(jì)值為,計(jì)算得,則原始憑證的差錯率的估計(jì)的標(biāo)準(zhǔn)差為。 (2)這里,每個層的層權(quán)是事先知道的,那么利用事后分層來計(jì)算登記原始憑證的差錯率的估計(jì)值為,在這里。 利用事后分層得到的原始憑證的差錯率的估計(jì)量的方差的估計(jì)值為 ,在不考慮有限校正系數(shù)的條件下,又可以寫為 ,其中 ,可以得到,則相應(yīng)的標(biāo)準(zhǔn)差為 。 3.9 解:(1)所有可能的樣本的數(shù)量為,所有的樣本如下: (2)我們用9個樣本中的一個來計(jì)算,假定抽中的樣本為。 首先按照分別比估計(jì)來估計(jì),首先可以得到分層后的輔助變量的總體均值分別為 。在這個樣本中,經(jīng)計(jì)算得到,,而且,則根據(jù)分別比估計(jì)可得的估計(jì)值為 。 利用聯(lián)合比估計(jì)時,首先計(jì)算得到輔助變量的總體均值,然后利用樣本得到的主要變量和輔助變量的樣本均值為,則利用聯(lián)合比估計(jì)得到的的估計(jì)值為。 在計(jì)算分別比估計(jì)和聯(lián)合比估計(jì)的偏差,這里的方法是利用所有可能的樣本,然后計(jì)算出比估計(jì)和聯(lián)合估計(jì)的估計(jì)值,按照與上面相同的計(jì)算方法,計(jì)算得到其他樣本時比估計(jì)和聯(lián)合估計(jì)值(按照上面的樣本的排列順序)為: 分別計(jì)算可得,而且可以計(jì)算得到,??傮w的實(shí)際均值為。則分別比估計(jì)和聯(lián)合比估計(jì)的偏差分別為 。 ,所以聯(lián)合比估計(jì)的偏差比分別比估計(jì)的偏差要小。 接下來計(jì)算分別比估計(jì)和聯(lián)合比估計(jì)的均方誤差。在這里樣本量很小,不可以利用教材中的近似公式。 (3)從分別比估計(jì)和聯(lián)合比估計(jì)的偏差和均方誤差可以看出,聯(lián)合比估計(jì)的偏差和均方誤差都要小于分別比估計(jì),也就是說在本題中,聯(lián)合比估計(jì)要比分別估計(jì)好。在本題中,各層的比率和總體的比率相差基本差不多,從整個樣本出發(fā)進(jìn)行的聯(lián)合比估計(jì)比基于每層的分別比估計(jì)更好一些,偏差更小,均方誤差也更小。 第4章 4.1解:由題意知,平均每戶家庭的訂報(bào)份數(shù)為: (份) 總的訂報(bào)份數(shù)為: (份) =0.358 333 所以估計(jì)方差為: =0.008 869 =141 900 4.2解: 單位 總?cè)藬?shù) 贊成人數(shù) 贊成比例 1 51 42 0.823 529 2 62 53 0.854 839 3 49 40 0.816 327 4 73 45 0.616 438 5 101 63 0.623 762 6 48 31 0.645 833 7 65 38 0.584 615 8 49 30 0.612 245 9 73 54 0.739 726 10 61 45 0.737 705 11 58 51 0.879 31 12 52 29 0.557 692 13 65 46 0.707 692 14 49 37 0.755 102 15 55 42 0.763 636 (1) =60.733 33 所以該系統(tǒng)同意這一改革人數(shù)的比例為: =70.91% 其估計(jì)的方差為: =0.001 37 所以其估計(jì)的標(biāo)準(zhǔn)誤為: =3.7% (2) =8% =0.006 4 得n=6.2,所以應(yīng)抽取7個單位作樣本。 4.3解:該集團(tuán)辦公費(fèi)用總支出額為: =48/10(83+62+…+67+80)=3 532.8(百元) =72 765.44 =269.750 7(百元) 所以其置信度為95%的置信區(qū)間為:[3 004.089 , 4 061.511] 4.4解:=52.3 所以整個林區(qū)樹的平均高度為: =5.9(米) 其估計(jì)的方差為: =0.06 所以其估計(jì)的標(biāo)準(zhǔn)誤為: =0.246(米) 其95%的置信區(qū)間為:[5.42 ,6.38] 4.5解:拍攝過藝術(shù)照的女生比例為: =9/30=30% 其估計(jì)的方差為: =0.005 891 其估計(jì)的標(biāo)準(zhǔn)差為: =7.68% 4.6 解: 其中, 所以最優(yōu)的樣本學(xué)生數(shù)為2。 代入得到 所以最優(yōu)的樣本宿舍數(shù)為20。 4.7解:(1)簡單估計(jì): 居民總的鍛煉時間為: =1 650 居民平均每天用于鍛煉的時間為: =3.3(即33分鐘) =0.163 421 其估計(jì)的標(biāo)準(zhǔn)差為: =0.404 254 (2)比率估計(jì): 居民總的鍛煉時間為: 居民平均每天用于鍛煉的時間為: =3.95(即39.5分鐘) =0.071 509 其估計(jì)的標(biāo)準(zhǔn)差為: =0.267 411 (3)簡單估計(jì)下的相對誤差為: r=0.404 254/3.3=12.25% 比估計(jì)下的相對誤差為: r=0.267 411/3.95=6.77% 所以比估計(jì)的估計(jì)效果好。 第5章 5.1解:(1)代碼法列出下表: PUS Zi Zi 1 000 000 累計(jì) Zi 1 000 000 代碼 1 0.000 110 110 110 1~110 2 0.018 556 18 556 18 666 111~18 666 3 0.062 999 62 999 81 665 18 667~81 665 4 0.078 216 78 216 159 881 81 666~159 881 5 0.075 245 75 245 235 126 159 882~235 126 6 0.073 983 73 983 309 109 235 127~309 109 7 0.076 580 76 580 385 689 309 110~385 689 8 0.038 981 38 981 424670 385 690~424 670 9 0.040 772 40 772 465 442 424 671~465 442 10 0.022 876 22 876 488 318 465 443~488 318 11 0.003 721 3 721 492 039 488 319~492 039 12 0.024 971 24 971 517 010 492 040~517 010 13 0.040 654 40 654 557 664 517 011~557 664 14 0.014 804 14 804 572 468 557 665~572 468 15 0.005 577 5 577 578 045 572 469~578 045 16 0.070 784 70 784 648 829 578 046~648 829 17 0.069 635 69 635 718 464 648 830~718 464 18 0.034 650 34 650 753 114 718 465~753 114 19 0.069 492 69 492 822 606 753 115~822 606 20 0.036 590 36 590 859 196 822 607~859 196 21 0.033 853 33 853 893 049 859 197~893 049 22 0.016 959 16 959 910 008 893 050~910 008 23 0.009 066 9 066 919 074 910 009~919 074 24 0.021 795 21 795 940 869 919 075~940 869 25 0.059 185 59 185 1 000 054 940 870~1 000 054 表中,Zi不是整數(shù),乘以1 000 000使其變?yōu)檎麛?shù),這樣就可以賦予每個單元與其相等的代碼數(shù)。 先在[1,1 000 054]中產(chǎn)生第一個隨機(jī)數(shù)為825 011,其對應(yīng)的單元為20號,則得到第一個入樣單元20; 把單元20去掉,剩余的24個單元,累計(jì)代碼數(shù)為1 000 054-36 590=963 464,在[1,963464]中產(chǎn)生第二個隨機(jī)數(shù)為456 731,得到第二個入樣單元9; 再把單元9去掉,剩余的23個單元,累計(jì)代碼數(shù)為963 464-40 772=922 692,在[1, 922 692]中產(chǎn)生第三個隨機(jī)數(shù)為857 190,得到第三個入樣單元24; 依此類推,直至抽出所需的樣本。 最后抽得的10個入樣單元為20,9,24,3,4,25,21,16,7,5。 (2)“拉希里法”。 令,,在[1,25]和[1, 0.078 216]中分別產(chǎn)生隨機(jī)數(shù),,第6號單元入樣; 把單元6去掉,剩余的24個單元,仍舊等于0.078 216,在[1,24]和[1, 0.078 216]中分別產(chǎn)生隨機(jī)數(shù),,第10號單元不入樣,重新抽取隨機(jī)數(shù); 依此類推,直至抽出所需的樣本。 最后抽得的10個入樣單元為6,9,18,4,1,5,19,21,16,13。 5.2.解:首先計(jì)算出各PSU單元的入樣概率,。 PSU 1 5 0.2 3,5,4,6,2 20 2 4 0.16 7,4,7,7 25 3 8 0.32 7,2,9,4,5,3,2,6 38 4 5 0.2 2,5,3,6,8 24 5 3 0.12 9,7,5 21 由 可得所有可能樣本的: 樣本 1,2 0.068 091 128.125 1,3 0.192 926 109.375 1,4 0.090 434 110 1,5 0.048 549 137.5 2,3 0.147 531 137.5 2,4 0.068 091 138.125 2,5 0.036 286 165.625 3,4 0.192 926 119.375 3,5 0.106 617 146.875 4,5 0.048 549 147.5 霍維茨-湯普森估計(jì)量的方差為。 5.3解:代碼法列出下表: i Zi Zi 1 000 累計(jì)Zi 1 000 代碼 1 0.104 104 104 1~104 2 0.192 192 296 105~296 3 0.138 138 434 297~434 4 0.062 62 496 435~496 5 0.052 52 548 497~548 6 0.147 147 695 549~695 7 0.089 89 784 696~784 8 0.038 38 822 785~822 9 0.057 57 879 823~879 10 0.121 121 1 000 880~1 000 表中,Zi不是整數(shù),乘以1 000使其變?yōu)檎麛?shù),這樣就可以賦予每個單元與其相等的代碼數(shù)。 在[1,1 000]之間產(chǎn)生三個隨機(jī)數(shù)659,722,498,則它們所對應(yīng)的第6,7,5號單元被抽中,即得到的n=3的PPS樣本包括單元6、單元7和單元5。 5.4解:由題意知n=3, 總體總量的估計(jì)為: 總量估計(jì)的標(biāo)準(zhǔn)差為: 5.5解:由題意知,,,每個單元的入樣概率。 1 2 0.086 956 52 0.173 913 2 9 0.391 304 35 0.782 609 3 3 0.130 434 78 0.260 87 4 2 0.086 956 52 0.173 913 5 1 0.043 478 26 0.086 957 6 6 0.260 869 57 0.521 739 所有可能的樣本及每對單元入樣概率為: 樣本 1,2 0.104 607 65.805 56 1,3 0.015 383 86.25 1,4 0.009 686 63.25 1,5 0.004 612 109.25 1,6 0.039 624 82.41 667 2,3 0.160 757 71.555 56 2,4 0.104 607 48.555 56 2,5 0.051 266 94.555 56 2,6 0.361 371 67.722 22 3,4 0.015 383 69 3,5 0.007 346 115 3,6 0.062 88.166 67 4,5 0.004 612 92 4,6 0.039 624 65.166 67 5,6 0.019 12 111.166 7 以實(shí)例驗(yàn)證式(5.5)、式(5.6): 設(shè)分別為7,20,12,4,6,22,當(dāng)入樣單元為單元1和單元2時,由式(5.5)可得。若由式(5.30)進(jìn)行計(jì)算,有。 二者的計(jì)算結(jié)果是一致的。當(dāng)入樣單元為其他情況時,計(jì)算過程同上,二者結(jié)果仍保持一致,從而驗(yàn)證了式(5.5)。 由式(5.6)可得。若直接進(jìn)行計(jì)算,有。 二者計(jì)算結(jié)果不一致,可見式(5.6)不適用于π抽樣的情況。 5.6 解:(1) 簡單隨機(jī)抽樣簡單估計(jì)量為:10,9,5,2,4。 均方誤差為: (2) 簡單隨機(jī)抽樣比估計(jì)為: ①聯(lián)合比估計(jì): 聯(lián)合比估計(jì)估計(jì)量為:,因此 均方誤差為: ②分別比估計(jì): 分別比估計(jì)估計(jì)量為:12.453 33,8.895 238,5.337 143,1.779 048,3.558 095,因此, 均方誤差為: (3)pps抽樣。 10 7 0.388 889 9 5 0.277 778 5 3 0.166 667 2 1 0.055 556 4 2 0.111 111 PPS抽樣漢森-赫維茨估計(jì)量:5.142 857,6.48,6,7.2,7.2,因此 均方誤差為: 通過以上計(jì)算可以看出,PPS抽樣漢森-赫維茨估計(jì)量的均方誤差最??;其次是簡單估計(jì)量的均方誤差;兩種比估計(jì)的均方誤差相差不大,但都要大于漢森-赫維茨和簡單估計(jì)量的均方誤差。 5.7解:設(shè)5個部門的職工總?cè)藬?shù)為150。 由題意得:,,,,由于該樣本為自加權(quán)的,則 由于,,估計(jì)的方差為: 估計(jì)的標(biāo)準(zhǔn)差為: 則該公司職工上班交通平均所需的時間為34分鐘,估計(jì)的標(biāo)準(zhǔn)差為6分鐘。 5.8解:由題意得:,。首先計(jì)算出抽中的10個單位的概率:。 單位編號 車輛數(shù) 單位運(yùn)量總和 平均每車運(yùn)量 1 5 0.026 882 14 230 2 846 2 8 0.043 011 21 336 2 667 3 5 0.026 882 13 650 2 730 4 4 0.021 505 11 568 2 892 5 6 0.032 258 15 216 2 536 6 9 0.048 387 23 049 2 566 7 5 0.026 882 13 650 2 730 8 3 0.016 129 7 443 2 481 9 7 0.037 634 16 723 2 389 10 3 0.016 129 8 391 2 797 根據(jù)漢森-赫維茨估計(jì)量的計(jì)算公式可得 即全集團(tuán)的季度總運(yùn)量為495 299.4噸。 方差估計(jì)量的估計(jì)為: 其95%的置信區(qū)間為: 。 第6章 6.1 解:(1)系統(tǒng)抽樣設(shè)計(jì)原理:見教材第164頁定義6.1。 (2)系統(tǒng)抽樣與整群抽樣、分層抽樣的關(guān)系: 系統(tǒng)抽樣按行來看,可看作一種特殊的整群抽樣;將每一行的單元視為群,則總體由k個群組成,每個群的大小都是n,即系統(tǒng)抽樣可看作從k個群中隨機(jī)抽取1個群的特殊整群抽樣。 系統(tǒng)抽樣按列來看,可看作一種特殊的分層抽樣;將每一列單元視為一層,則總體由n個層組成,每個層的大小都是k,則系統(tǒng)抽樣可看作從n個層中隨機(jī)抽取一個單元的特殊分層抽樣。 6.2解:見教材第170頁定理6.2的證明。 6.3解:將40個人依次編號為1~40號,且將這些編號看成首尾相接的一個環(huán)。 已知總體容量N=40,樣本量n=7。由于N/n=5.7,取最接近5.7的整數(shù)6,則抽樣間距k=6。 由于隨機(jī)起點(diǎn)r=5,則其余樣本點(diǎn)依次為11,17,23,29,35,1。 因此,用循環(huán)等距抽樣方法抽出的樣本單元序號為5,11,17,23,29,35,1。 6.4解: 對于總體,容量N=360,漢族住戶總數(shù)A=81,漢族比重P=A/N=0.225。 對于樣本,抽樣間距k=8,樣本量n=N/k=45。 簡單隨機(jī)抽樣: 系統(tǒng)抽樣: 則。 其中 “系統(tǒng)樣本” 隨機(jī)起點(diǎn)號碼r “系統(tǒng)樣本” 的單元組成 “系統(tǒng)樣本”中 漢族住戶總數(shù) “系統(tǒng)樣本”中漢族住戶比例 1 2 3 4 5 6 7 8 略(樣本量45) 7 13 10 10 12 9 10 10 7/45 13/45 10/45 10/45 12/45 9/45 10/45 10/45 6.5解:(1)估計(jì)漢族所占比例,采用等距抽樣效果最好。 理由:系統(tǒng)抽樣可看作一種特殊的整群抽樣,則希望系統(tǒng)抽樣抽取的樣本能更好地體現(xiàn)總體性質(zhì)。由于三個民族的居民居住地緊鄰,采取等距抽樣能使樣本中三個民族的分布與總體分布類似,即差異較小。若采用簡單隨機(jī)抽樣,可能出現(xiàn)的情況是,抽取的樣本中有過多的漢族居民,而等距抽樣會避免該現(xiàn)象的發(fā)生。 (2)估計(jì)男性所占比例,采用簡單隨機(jī)抽樣效果最好。 理由:由題意知,每戶人口登記順序?yàn)椋赫煞颉⑵拮?、孩子、其他人,且平均每戶?口人。若采取等距抽樣,由于抽樣間距k=5,若隨機(jī)起點(diǎn)號碼為1,則第一戶抽取丈夫,第二胡抽取丈夫的可能性較大,依此類推,抽取的樣本中,丈夫所占的比重較大,估計(jì)時誤差會很大。而簡單隨機(jī)抽樣會避免該情況的發(fā)生。 (3)估計(jì)孩子所占比例,理由同(2)。 6.6解:(1)估計(jì)男性所占比例。 已知總體容量N=50,男性總數(shù)A=24,男性所占比例P=A/N=0.48。 抽樣間距k=5,樣本量n=N/k=10。 簡單隨機(jī)抽樣: 系統(tǒng)抽樣: 則。 其中 “系統(tǒng)樣本” 隨機(jī)起點(diǎn)號碼r “系統(tǒng)樣本”的單元組成 “系統(tǒng)樣本” 中男性總數(shù) “系統(tǒng)樣本” 中男性比例 1 2 3 4 5 M M M F f M F F f M F F F M M F m m M F f f m F F f f M F f m m f m f f m F f M f f M m m M M m m F 5 5 2 5 7 0.5 0.5 0.2 0.5 0.7 (2)估計(jì)孩子所占比例。 已知總體容量N=50,孩子總數(shù)A=24,孩子所占比例P=A/N=0.48。 簡單隨機(jī)抽樣: 系統(tǒng)抽樣: 則。 (3)估計(jì)職業(yè)住戶中人員所占比例。 已知總體容量N=50,職業(yè)住戶總數(shù)A=19,職業(yè)住戶所占比例P=A/N=0.38。 簡單隨機(jī)抽樣: 系統(tǒng)抽樣: 則。 6.7解:已知總體容量N=15,總體均值。 樣本量n=3,抽樣間距k=N/n=5。 簡單隨機(jī)抽樣: 系統(tǒng)抽樣: 其中 “系統(tǒng)樣本” 隨機(jī)起點(diǎn)號碼r “系統(tǒng)樣本” 的單元組成 “系統(tǒng)樣本” 樣本均值 1 2 3 4 5 1,6,11 2,7,12 3,8,13 4,9,14 5,10,15 6 7 8 9 10 6.8解:書稿平均錯字?jǐn)?shù) 抽樣方差的估計(jì)如下: (1)合并層方法估計(jì)抽樣方差為: (2)連續(xù)差方法估計(jì)抽樣方差為: (3)交叉子樣本方法估計(jì)抽樣方差為: 第7章 7.1解:根據(jù)表中數(shù)據(jù),可計(jì)算各層的權(quán)重: =0.17, =0.25, =0.28, =0.22, =0.08 全縣棉花的種植面積為: =0.1790/17+0.251 806/25 +0.284 423/28+0.225 607/22+0.084 101/8 =164.27 根據(jù)式(7.4), 的抽樣方差為: =14.578 5+25.141 46 =39.719 96 所以全縣棉花種植面積的抽樣標(biāo)準(zhǔn)誤的估計(jì)為: 12 604.75 7.2 解:(1) 由題意知 ,,,,, 根據(jù)公式(7.10)有 根據(jù)公式(7.8),有 ≈ ≈0.000 667 (2)調(diào)查總費(fèi)用為3 000元,每一個抽樣單元的調(diào)查費(fèi)用為10元,采用簡單隨機(jī)抽樣,樣本量可以達(dá)到300,估計(jì)量的方差為: 則有 由此可知二重抽樣效率更高。 7.3 解:由題知=602,由表內(nèi)數(shù)據(jù)計(jì)算得 =568.583 3 ,=568.25,1.000 587,=256 154.9 ,=278 836.9 ,=256 262 根據(jù)式(7.11),該地區(qū)當(dāng)年平均每村牛的年末頭數(shù)為: 602(頭) 所以該地區(qū)年末牛的總頭數(shù)為: 745 713(頭) 根據(jù)式(7.15), 的方差估計(jì)為: 所以該地區(qū)年末牛的總頭數(shù)估計(jì)的標(biāo)準(zhǔn)差為: 46 398(頭) 7.4 解:(1)根據(jù)公式(7.10),有 根據(jù)公式(7.8),有 即二重抽樣的樣本最優(yōu)分配方案是第一層分配63個樣本,第二層分配31個樣本。 (2) 令c1/c2h=a,則c1/= c2h=a,若二重抽樣的精度高于簡單隨機(jī)抽樣,則有 7.5解:由題意知: n1=300, n2=200, m=62,該保護(hù)區(qū)現(xiàn)有羚羊總數(shù)為: (頭) 其抽樣的標(biāo)準(zhǔn)誤為: (頭) 7.6 解:(1)由題意知: n1=7, n2=12, m=4,該地區(qū)漁民總數(shù)為: (人) 其抽樣的標(biāo)準(zhǔn)誤為: (人) 其95%的置信區(qū)間為: =[12,28] (2) 由題意知: n1=16, n2=19, m=11,該地區(qū)漁民總數(shù)為: (人) 其抽樣的標(biāo)準(zhǔn)誤為: (人) 其95%的置信區(qū)間為: =[22,34] (3)計(jì)算這些估計(jì)時的前提假設(shè): ①總體是封閉的——兩次抽樣間沒有漁民進(jìn)入或離開該地區(qū),即對每次抽樣而言,N是相同的。 這要求漁民在兩次抽樣間不能離開該地區(qū),其他漁民也不能進(jìn)入,但這在實(shí)際中是很難做到的。 ②每個樣本都是來自總體的簡單隨機(jī)抽樣,即該地區(qū)每個漁民都有同樣的機(jī)會被找到。在實(shí)際中由于漁民所在地和作業(yè)時間的不同,不可能每一個漁民在調(diào)查時都能被找到,比如某些住在偏僻位置的漁民被找到的機(jī)會就會小些。 ③兩個樣本是獨(dú)立的,即漁民第一次被找到的概率跟第二次能否被找到的概率沒有關(guān)系。 ④不會丟失第一次被找到的漁民資料,即第一次被找到的漁民,在第二次被找到時可識別。 ⑤近似服從正態(tài)分布。 7.7 解:(1)如果NCRSR和BDMP登記體系是兩個獨(dú)立的系統(tǒng),也就是兩個系統(tǒng)在登記病人時是獨(dú)立進(jìn)行的,病人出現(xiàn)在NCRSR中的概率與出現(xiàn)在BDMP中的概率無關(guān),那么作者的認(rèn)識就是正確的。 第一,滿足總體是封閉的假設(shè), NCRSR和BDMP登記系統(tǒng)都是針對全國人口進(jìn)行登記,而且是在同一段時間范圍內(nèi)進(jìn)行,因此總體單元數(shù)是一樣的。 第二,滿足標(biāo)識不丟失的假設(shè),先天性風(fēng)疹綜合征在出生時就會被確定出,不會因?yàn)橐院笫欠窕謴?fù)而被更改。 第三,可能不滿足每個樣本都是來自總體的簡單隨機(jī)樣本。簡單隨機(jī)樣本要求每個樣本入樣概率相同,從全國范圍看,這一假設(shè)不一定能滿足。比如由于抽樣框的原因,偏遠(yuǎn)地區(qū)或者欠發(fā)達(dá)地區(qū)的人群被登記的概率會低于中心地區(qū)或者發(fā)達(dá)地區(qū)。 (2)由公式(7.21)得每年的如下表: 年份 NCRSR(n1) BDMP(n2) 兩者均有(m) 1970 45 15 2 244 1971 23 3 0 95 1972 20 6 2 48 1973 22 13 3 80 1974 12 6 1 45 1975 22 9 1 114 1976 15 7 2 42 1977 13 8 3 31 1978 18 9 2 62 1979 39 11 2 159 1980 12 4 1 32 1981 4 0 0 4 1982 11 2 0 35 1983 3 0 0 3 1984 3 0 0 3 1985 1 0 0 1 (3)累計(jì)所有年份的數(shù)據(jù),得到n10=263, n20=93, m0=19,由公式(7.21)得到1970—1985年間先天性風(fēng)疹綜合征的總病例數(shù)為: (人) 累計(jì)(2)的估計(jì)結(jié)果得到1970—1985年間先天性風(fēng)疹綜合征的總病例數(shù)為998人。 從結(jié)果上看,我們認(rèn)為(3)的計(jì)算結(jié)果更可信,因?yàn)?3)的樣本量足夠大。 (4)直觀上由下圖發(fā)現(xiàn)先天性風(fēng)疹綜合征的患病人數(shù)是在下降。 第8章 8.13 解:(1)原假設(shè):患有婦科疾病與是否遭受配偶性虐待相互獨(dú)立。在原假設(shè)成立條件下,各單元格的期望頻數(shù)為: (2) 如果顯著性水平,拒絕原假設(shè),即認(rèn)為婦科疾病與是否遭受配偶性虐待不獨(dú)立。 (3)應(yīng)用傳統(tǒng)的卡方檢驗(yàn)方法的前提是樣本中各觀測值的權(quán)數(shù)相等。本題中樣本由于存在無回答情形,各觀測值的權(quán)數(shù)不一定相等,因此傳統(tǒng)的卡方檢驗(yàn)方法不合適。 8.14解:設(shè)總體相關(guān)系數(shù)為,其中,為總體標(biāo)準(zhǔn)差。 又 所以 (2) ,這里。 (3) 第9章 9.1 解:首先計(jì)算每套子樣本中的居民家庭平均年總收入,結(jié)果如下表所示: 子樣本 1 2 3 4 5 平均收入 17.8 18.7 19.3 19 19 用(=1,2,3,4,5)表示每套子樣本中的居民家庭平均年總收入,則 =18.76 從而 =0.066 6 的95%置信區(qū)間為: 9.2 解:要估計(jì)的比率是,其中,X和Y分別是該地區(qū)的勞動人口數(shù)和失業(yè)人數(shù)。由于每層的權(quán)重一樣,故R的估計(jì)為: =359/3 643=0.09 854 516 現(xiàn)采用刀切法估計(jì)失業(yè)率的方差,將每個層視為一組,從而有 ==271/2 681=0.1 010 817 ==259/2 691=0.09 624 675 ==276/2 777=0.09 938 783 ==271/2 780=0.09 748 201 因此有 0.090 936 0.105 44 0.096 017 0.101 735 根據(jù)刀切法,估計(jì)該區(qū)的人口出生率為: 0.098 532 的刀切法方差估計(jì)為: = = == 9.3解:要估計(jì)的比率是,其中,x和y分別是該區(qū)的人口數(shù)和新生嬰兒數(shù)。由于每個初級抽樣單元的大小相等,且第二階段抽取的樣本量也一樣。因而,R的估計(jì)為: = =0.009 723 187 現(xiàn)采用刀切法估計(jì)人口出生率的方差。將每個街道中的所有居委會視為一組,從而有 ==0.009 675 282 ==0.010 060 1 ==0.009 425 196 ==0.009 726 849 因此有 0.009 867 0.008 712 0.010 617 0.009 712 根據(jù)刀切法,估計(jì)該區(qū)的人口出生率為: 0.009 727 的刀切法方差估計(jì)為: = = == 第10章 10.6解:該總體真實(shí)均值為 (1)對于一個在60%層中抽樣的方法: bias=40.7-46.08=-5.38 (2)當(dāng)回答率為60%時,由(1)有 即均方誤差的根不可能達(dá)到5%。 當(dāng)回答率為80%時 bias=43.5-46.08=-5.38 當(dāng)回答率高于80%時 | bias |<2.58 而對于所有的回答率方法均有 因而當(dāng)采用80%或更高回答率時 只要當(dāng)n稍稍大于100,便有 (3)采用90%方法時 bias=44.8-46.08=-1.28 得n=1 047 采用95%方法時 bias=45.4-46.08=-0.68 得n=701 10.7解:由上題(3)知,當(dāng)回答率為90%時n=1 047,則 總費(fèi)用=51 047=5 235 當(dāng)回答率為95%時,n=701,則 總費(fèi)用= 37- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 抽樣技術(shù) 抽樣 技術(shù) 第四 習(xí)題 答案
鏈接地址:http://m.appdesigncorp.com/p-6562502.html