《53第5章第3節(jié)假設(shè)檢驗課件》由會員分享,可在線閱讀,更多相關(guān)《53第5章第3節(jié)假設(shè)檢驗課件(17頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、5.3,假設(shè)檢驗概述,江蘇師范大學(xué),第,*,頁,第 5 章 參數(shù)估計與假設(shè)檢驗,5.3 假設(shè)檢驗概述目錄,本章目錄,5.3.1 假設(shè)檢驗問題,5.3.2 參數(shù)假設(shè)檢驗的思想方法,5.3.3 參數(shù)假設(shè)檢驗的一般步驟,5.3.4 檢驗的顯著性水平與兩類錯誤,5.3.5 檢驗的,p,值,5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗問題,5.3 假設(shè)檢驗概述,本章目錄,本節(jié)目錄,統(tǒng)計推斷的另一個主要內(nèi)容是(統(tǒng)計)假設(shè)檢驗,本節(jié)主要介紹,參數(shù)假設(shè)檢驗,的基本概念和基本思想方法。,例,某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有200 件產(chǎn)品準備出廠,從中隨機抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?
2、,本章目錄,5.3.1 假設(shè)檢驗問題,本節(jié)目錄,為了說明什么是假設(shè)檢驗問題,先看幾個實際例子。,設(shè)這批產(chǎn)品的次品率為,p,,,問題就是要回答“,p,1%”是否成立。,例,某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗,廢水中所含某種有毒物質(zhì)的濃度,X,(單位:mg/kg)服從正態(tài)分布。現(xiàn)環(huán)保部門抽測了9個水樣,算得樣本平均值為 ,樣本標準差為,s,=2.4,以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問有毒物質(zhì)的平均濃度有無顯著變化?,本章目錄,本節(jié)目錄,X,N,(,2,),其中,2,均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機性造成的。,問題是要判定有毒物質(zhì)
3、的平均濃度是否還是18.2,mg/kg,。,例,隨機抽測了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重,X,是否服從正態(tài)分布。,本章目錄,本節(jié)目錄,問題是要判定,X,N,(,2,)是否成立?,上述各例所述問題的共同點是:對總體分布的,參數(shù),或,總體分布的類型,提出假設(shè),希望通過抽得的樣本信息對“假設(shè)是否成立”進行推斷。這類問題稱為,假設(shè)檢驗問題,。,本章目錄,本節(jié)目錄,在假設(shè)檢驗問題中,通常把待檢驗的假設(shè)稱為,原假設(shè),或,零假設(shè),,記為,H,0,,與之對應(yīng)的假設(shè)則稱為,備擇假設(shè),,記為,H,1,。在統(tǒng)計學(xué)中這兩個假設(shè)統(tǒng)稱為,統(tǒng)計假設(shè),,簡稱,假設(shè),。統(tǒng)計假設(shè)通常記為,H,0,v
4、s,H,1,。,比如,例、例和例的統(tǒng)計假設(shè)分別為:,例,某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有200 件產(chǎn)品準備出廠,從中隨機抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,本章目錄,本節(jié)目錄,設(shè)這批產(chǎn)品的次品率為,p,,,問題就是要回答“,p,1%”是否成立。,統(tǒng)計假設(shè)為,H,0,:,p,1%vs,H,1,:,p,1%,例,某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗,廢水中所含某種有毒物質(zhì)的濃度,X,(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了9個水樣,算得樣本平均值為 ,樣本標準差為,s,=2.4,以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問有毒物質(zhì)的平均濃度
5、有無顯著變化?,本章目錄,本節(jié)目錄,X,N,(,2,),其中,2,均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機性造成的。,問題是要判定有毒物質(zhì)的平均濃度是否還是18.2,mg/kg,。,統(tǒng)計假設(shè)為,H,0,:,=18.2 vs,H,1,:,18.2,例,隨機抽測了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重,X,是否服從正態(tài)分布。,本章目錄,本節(jié)目錄,問題是要判定,X,N,(,2,)是否成立?,統(tǒng)計假設(shè)為,H,0,:,X,N,(,2,)vs,H,1,:,X,不服從正態(tài)分布。,本章目錄,本節(jié)目錄,在假設(shè)檢驗問題中,若總體的分布類型是已知的,未知的只
6、是其中的一個或幾個參數(shù),統(tǒng)計假設(shè)只與這些未知參數(shù)有關(guān),我們稱為,參數(shù)假設(shè),,相應(yīng)的檢驗稱為,參數(shù)假設(shè)檢驗,。若總體的分布類型未知,統(tǒng)計假設(shè)是總體分布的類型或某些特征,我們稱此類假設(shè)為,非參數(shù)假設(shè),,相應(yīng)的檢驗稱為,非參數(shù)假設(shè)檢驗,。,進一步地,在參數(shù)假設(shè)檢驗問題中,總體中可能有多個未知的參數(shù),有時只對其中某一個參數(shù)提出假設(shè)并進行檢驗,有時需要對多個參數(shù)一起提出一個假設(shè)并進行檢驗,根據(jù)這一區(qū)別,我們可將參數(shù)假設(shè)檢驗細分為,單參數(shù)假設(shè)檢驗,與,多參數(shù)假設(shè)檢驗,。,例5.3.1 和例5.3.2 都是參數(shù)假設(shè)檢驗問題,而例 5.3.3 就是一個非參數(shù)假設(shè)檢驗問題。下面重點討論單參數(shù)假設(shè)檢驗問題。,本章
7、目錄,5.3.2 參數(shù)假設(shè)檢驗的思想方法,本節(jié)目錄,例(續(xù)),某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有 200 件產(chǎn)品準備出廠,從中隨機抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,解,統(tǒng)計假設(shè)為,H,0,:,p,1%vs,H,1,:,p,1%,仍用上面的例子來說明假設(shè)檢驗的基本思想方法:,若統(tǒng)計假設(shè),H,0,成立(即,p,1%),則事件,A,=“任取 5 件中有次品”發(fā)生的概率為,也就是說,如果,H,0,成立,則任取 5 件中有次品的概率很小,現(xiàn)在這種“罕見”的情況發(fā)生了,其根源是假設(shè)了,H,0,成立,因此我們有理由拒絕此假設(shè),并作出這批產(chǎn)品不能出廠的決定。,上述思路可歸結(jié)為
8、:,若假設(shè),H,0,:,p,1%成立,看看會推出什么結(jié)果,。,若假設(shè),H,0,:,=,0,=18.2 成立(即假設(shè)有毒物質(zhì)的濃度無顯著變化),看看會推出什么結(jié)果?,例(續(xù)),某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗,廢水中所含某種有毒物質(zhì)的濃度,X,(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了 9 個水樣,算得樣本平均值為 ,樣本標準差為,s,=2.4,以往該廠廢水中有毒物質(zhì)的平均濃度為 18.2,試問有毒物質(zhì)的平均濃度有無顯著變化?,本章目錄,本節(jié)目錄,解,統(tǒng)計假設(shè)為,H,0,:,=18.2 vs,H,1,:,18.2,設(shè)(,X,1,X,2,X,n,)為正態(tài)總體的一個樣本,(,x
9、,1,x,2,x,n,)是相應(yīng)的樣本觀察值。樣本均值是未知參數(shù),的無偏估計量,為相應(yīng)的估計值。我們也許想到用,的估計值代替,來檢驗,H,0,,但由于樣本的隨機性造成的估計誤差使得幾乎不會真正等于,,所以即使,H,0,:,=,0,為真,由于估計誤差的存在,也不會真正等于,0,。因而我們不能簡單地根據(jù)是否有來判斷,H,0,:,=,0,是否成立。,本章目錄,本節(jié)目錄,但是,如果,H,0,:,=,0,為真,那么會以很大的概率落在,0,附近的一定范圍內(nèi),而遠離,0,的概率會很小。即,只要,d,足夠的大,則會很小。如果在一次觀察中出現(xiàn)了,根據(jù)小概率原理(認為小概率事件在一次試驗中不會發(fā)生),我們自然有充足
10、的理由,否定,H,0,:,=,0,;相反,如果不成立,則沒有充足的理由否定,H,0,:,=,0,,也稱,不能拒絕假設(shè),H,0,。,上面的論述事實上提供了解決例的方法,具體解決步驟后面再作詳細論述。,從上面的討論可以看出,要實施檢驗(是否拒絕假設(shè),H,0,),首先要確定小概率的大小,這一小概率在假設(shè)檢驗中稱為,檢驗的顯著性水平,,通常記作,。它是根據(jù)具體問題而需要事先確定的一個很小的正數(shù),比如0.01,0.05,0.10等。其次,對給定的顯著性水平,,還需要確定一個由樣本所描述的概率不超過顯著性水平,的小概率事件,這一小概率事件對應(yīng)的樣本取值區(qū)域通常稱為,假設(shè)檢驗的拒絕域,,簡稱,拒絕域,。最后
11、看樣本觀察值是否落入拒絕域,若樣本觀察值落入拒絕域便可以拒絕,H,0,;否則,就不能拒絕,H,0,。,本章目錄,5.3.3 參數(shù)假設(shè)檢驗的一般步驟,本節(jié)目錄,參數(shù)假設(shè)檢驗的一般步驟可歸納為:,第一步,:提出統(tǒng)計假設(shè),H,0,vs,H,1,;,第二步,:選取,的一個較優(yōu)的點估計 ,并根據(jù) 給出拒絕域的形式(在,H,0,成立前提下);,第三步,:圍繞 構(gòu)建樞軸量并確定其分布;,第四步,:對給定的顯著性水平,,確定拒絕域,C,使得,P,(,X,1,X,2,X,n,),C,|,H,0,),;,第五步,:如果(,x,1,x,2,x,n,),C,,則在顯著性水平,下拒絕,H,0,;否則,則不能拒絕,H,0
12、,。,本章目錄,5.3.4 檢驗的顯著性水平與兩類錯誤,本節(jié)目錄,在假設(shè)檢驗問題中,由樣本提供的信息來推斷是否“拒絕假設(shè),H,0,”時,用了“小概率原理”,但小概率事件并非不可能事件,如果零假設(shè),H,0,本為真,但因樣本值落入拒絕域而作出了拒絕,這便犯了,棄真錯誤,,通常稱為,第一類錯誤,;相反,如果零假設(shè),H,0,本不成立,卻因樣本值沒有落入拒絕域而作出了不能拒絕,這便犯了,納偽錯誤,,通常稱為,第二類錯誤,。,根據(jù)檢驗法則知,當,H,0,成立時,拒絕,H,0,的概率小于等于顯著性水平,,這表明犯第一類錯誤的概率至多為,,從而說明檢驗的顯著性水平,是用以控制犯第一類錯誤的概率的。由此可能會產(chǎn)
13、生一種錯覺,以為只要把顯著性水平,取得越小,假設(shè)檢驗的準確程度就會越高。事實上不然,因為顯著性水平,只是用來控制犯第一類錯誤的概率,而在假設(shè)檢驗中還存在著犯第二類錯誤的可能性。一般來說,當樣本容量,n,給定時,在降低顯著性水平,的同時,拒絕域往往也在變小,從而會增大犯第二類錯誤的可能性。通常的做法是,事先給定顯著性水平,來控制犯第一類錯誤的概率,再通過選取較好的檢驗方法盡可能地減少犯第二類錯誤的概率,(比如,拒絕域盡可能取大些)。,本章目錄,5.3.5 檢驗的,p,值,本節(jié)目錄,可以看出,顯著性水平,越小,則相應(yīng)的拒絕域就越?。划旓@著性水平,取得足夠小時,可以使得樣本值不落在相應(yīng)的拒絕域中,從
14、而在此顯著性水平,下不能拒絕假設(shè),H,0,。當顯著性水平,由上述足夠小的值不斷增大時,相應(yīng)的拒絕域也就越來越大,當顯著性水平,大到一定程度時,便可以使得樣本值落入相應(yīng)的拒絕域中,從而在此顯著性水平,下可以拒絕假設(shè),H,0,。,也就是說,對于一個確定的樣本值,存在一個實數(shù),p,(0,p,1),在顯著性水平等于,p,下可以拒絕假設(shè),H,0,,而在小于,p,的顯著性水平下不能拒絕假設(shè),H,0,??梢?,,p,是使得依據(jù)給定樣本值作出“拒絕假設(shè),H,0,”的最小的顯著性水平,稱之為檢驗的,p,值。,多數(shù)統(tǒng)計軟件都提供,p,值的輸出結(jié)果,人們就不必針對每個顯著性水平,查相應(yīng)分布的下側(cè)分位數(shù),只要直接比較,與,p,值即可。,本章目錄,5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗問題,本節(jié)目錄,前面對單參數(shù)假設(shè)檢驗問題作了比較詳盡的討論,其解決問題的基本思想方法也適用于多參數(shù)假設(shè)檢驗或非參數(shù)假設(shè)檢驗問題,只是在具體細節(jié)上作適當調(diào)整即可。為此,僅說明兩點:,對于多參數(shù)假設(shè)檢驗問題,需尋求一個包含所有待檢驗參數(shù)的樞軸量,并使之服從或漸近地服從一個已知的確定分布;,非參數(shù)假設(shè)檢驗問題可以近似地化為一個多參數(shù)假設(shè)檢驗問題來解決。,