金融統(tǒng)計(jì)03-假設(shè)檢驗(yàn)與方差分析.ppt
《金融統(tǒng)計(jì)03-假設(shè)檢驗(yàn)與方差分析.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《金融統(tǒng)計(jì)03-假設(shè)檢驗(yàn)與方差分析.ppt(36頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
第3章假設(shè)檢驗(yàn)與方差分析,第1節(jié)假設(shè)檢驗(yàn)第2節(jié)方差分析第3節(jié)方差分析應(yīng)用:恩格爾系數(shù)的城鄉(xiāng)比較,第1節(jié)假設(shè)檢驗(yàn),主要內(nèi)容假設(shè)檢驗(yàn)的概念假設(shè)檢驗(yàn)的標(biāo)準(zhǔn)假設(shè)檢驗(yàn)的步驟,假設(shè)檢驗(yàn)的概念及形式,假設(shè)檢驗(yàn)對(duì)總體的某個(gè)參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷假設(shè)是否成立假設(shè)檢驗(yàn)的形式假設(shè)分為原假設(shè)(H0)和備擇假設(shè)(H1)兩種原假設(shè)(Nullhypothesis):初始假定為真的假設(shè)備擇假設(shè)(Alternativehypothesis):與原假設(shè)的內(nèi)容相反,當(dāng)原假設(shè)被拒絕時(shí),被認(rèn)為是真的假設(shè)應(yīng)用中,原假設(shè)一般是舊的、他人的觀點(diǎn)或理論,備擇假設(shè)一般是新的、自己的觀點(diǎn)或理論,而統(tǒng)計(jì)分析的目的往往就是以新的數(shù)據(jù)來拒絕原假設(shè),支持自己的觀點(diǎn)所以,習(xí)慣上,能拒絕原假設(shè)的檢驗(yàn),稱為顯著的、有統(tǒng)計(jì)意義的(Significant),否則為不顯著,原假設(shè)(H0)和備擇假設(shè)(H1)例,某汽車使用改進(jìn)型發(fā)動(dòng)機(jī)后聲稱油耗不超過百公里6升,對(duì)此進(jìn)行檢驗(yàn)檢驗(yàn)假設(shè)的設(shè)定:設(shè)u為百公里平均油耗,則單邊檢驗(yàn)(只檢驗(yàn)小于或大于檢驗(yàn)值中的一種情況)工廠對(duì)收到的一批長度為2cm的零件抽檢,檢驗(yàn)長度是否合格?檢驗(yàn)假設(shè)的設(shè)定:設(shè)u為平均長度,則雙邊檢驗(yàn)(同時(shí)檢驗(yàn)小于、大于檢驗(yàn)值的兩種情況,常用),假設(shè)檢驗(yàn)的標(biāo)準(zhǔn):顯著水平,顯著水平的定義假設(shè)檢驗(yàn)中的第一類錯(cuò)誤(typeIerror):拒絕正確的原假設(shè)(H0)顯著水平指犯第一類錯(cuò)誤的最大概率,通常設(shè)定為5%或1%顯著水平的理解形象的說,顯著水平為1%是指,拒絕100次原假設(shè),只有1次是拒絕錯(cuò)了(即只有1次原假設(shè)確實(shí)正確)因?yàn)樵僭O(shè)往往是公認(rèn)的觀點(diǎn)、成熟的理論,甚至已經(jīng)反復(fù)檢驗(yàn)證明是正確的,所以為了加強(qiáng)拒絕的說服力,應(yīng)設(shè)定一個(gè)嚴(yán)格的拒絕標(biāo)準(zhǔn),即要將顯著水平設(shè)的很小顯著水平越小,原假設(shè)值的允許變動(dòng)范圍就越大,備擇假設(shè)成立的范圍就越小,備擇假設(shè)成立的概率就越小。如果能成立,則結(jié)論就很有說服力,不同顯著水平的比較(單邊檢驗(yàn)),假設(shè)國家標(biāo)準(zhǔn)規(guī)定冰箱使用年限必須10年或以上對(duì)某品牌抽樣檢驗(yàn)時(shí),如果顯著水平設(shè)為40%,則樣本均值9年或以下即可認(rèn)定為不合格。顯著水平設(shè)為5%,則樣本均值4年或以下才可認(rèn)定為不合格,相當(dāng)于把原假設(shè)放寬到H0>4,更有說服力,,原假設(shè)H0=10即假設(shè)某品牌合格,4,,,,,,,,,,,某品牌冰箱總體的特征,顯著水平5%,,,,概率,,顯著水平40%,,9,10,冰箱使用年限,圖中4為5%的臨界值9為40%的臨界值,顯著水平的運(yùn)用:t統(tǒng)計(jì)量,t統(tǒng)計(jì)量的定義假定總體服從正態(tài)分布,則抽取的樣本的平均值可用下列公式換算成t分布的值(簡稱t值),該值可用來判斷樣本平均值相對(duì)于總體平均值的誤差程度t統(tǒng)計(jì)量公式的理解公式中總體均值μ0在假設(shè)檢驗(yàn)時(shí),等于原假設(shè)H0的值上述t值公式就是將樣本均值換算成一個(gè)標(biāo)準(zhǔn)化的t值,這與將正態(tài)變量換算成標(biāo)準(zhǔn)正態(tài)變量一樣,所以t分布的中心為0顯然,t值的絕對(duì)值越大,樣本均值離原假設(shè)H0的值越遠(yuǎn),樣本越不支持原假設(shè),顯著水平的運(yùn)用:t檢驗(yàn),顯著水平在t檢驗(yàn)中的運(yùn)用過程如下:假定原假設(shè)成立,比如將樣本統(tǒng)計(jì)量的值按前述公式換算成t值,其中μ0等于原假設(shè)的,比如10從t分布表查出某一顯著水平(比如5%)的臨界值t0.05比較換算的t值與臨界值t0.05。如果|t值|>t0.05,則拒絕原假設(shè),反之,接受原假設(shè),t檢驗(yàn)示意圖(雙邊檢驗(yàn),顯著水平設(shè)為5%),將樣本均值換算成標(biāo)準(zhǔn)化的t值,如果|t值|>臨界值,表明樣本均值離原假設(shè)的總體均值很遠(yuǎn),樣本來自于這個(gè)總體的可能性很小,于是原假設(shè)(H0)成立的概率也很小,所以拒絕H0,,0,t臨界值(約為-2),2.5%,t值,拒絕域,,,,,,,,,,,,單邊檢驗(yàn)示意圖,,顯著水平,,,,,概率,,拒絕域,,,t臨界值(約為2),,2.5%,,95%,假設(shè)檢驗(yàn)的實(shí)用標(biāo)準(zhǔn):P值,根據(jù)樣本值計(jì)算的顯著水平又稱為P值比如:5%顯著水平下的臨界值為4,而實(shí)際的樣本均值為3,小于臨界值,則P值也小于5%(比如4%等)統(tǒng)計(jì)軟件作檢驗(yàn)時(shí),通常會(huì)根據(jù)樣本值計(jì)算相應(yīng)的P值,所以一般直接使用P值作為假設(shè)檢驗(yàn)的標(biāo)準(zhǔn),非常方便判斷原理如下如果P值≤1%,則檢驗(yàn)值在1%水平顯著,拒絕H0如果1%5%,則檢驗(yàn)值不顯著,接受H0,P值與t統(tǒng)計(jì)量,主要區(qū)別P值不依賴于樣本變量的分布形式,適用于任何假設(shè)檢驗(yàn),而t統(tǒng)計(jì)量依賴于樣本變量的分布,適用范圍有限P值可直接與顯著水平比較,判斷簡單,而t統(tǒng)計(jì)量需查表、換算,判斷復(fù)雜在應(yīng)用統(tǒng)計(jì)的假設(shè)檢驗(yàn)中,更多使用P值作為檢驗(yàn)標(biāo)準(zhǔn)主要聯(lián)系一般情況下,P值和t值有如下對(duì)應(yīng)關(guān)系:P值≤5%時(shí),|t值|≥2所以實(shí)用中(比如回歸分析中),要獲得有統(tǒng)計(jì)意義的結(jié)論(即在5%顯著水平拒絕原假設(shè)(H0)),可作下列任一種判斷:看P值時(shí),應(yīng)≤5%看|t值|時(shí),應(yīng)≥2,假設(shè)檢驗(yàn)的步驟,(1)選擇要檢驗(yàn)的統(tǒng)計(jì)量(比如樣本均值)(2)確定原假設(shè)(H0)和備擇假設(shè)(H1)(3)確定檢驗(yàn)的顯著水平(一般為5%)(4)查表確定與顯著水平相對(duì)應(yīng)的t分布的臨界值(5)將要檢驗(yàn)的統(tǒng)計(jì)量換算成標(biāo)準(zhǔn)化的t值(6)根據(jù)要檢驗(yàn)的統(tǒng)計(jì)量的|t值|大于還是小于臨界值,決定是否拒絕原假設(shè)(H0)如果使用統(tǒng)計(jì)軟件,則只要(1)、(2)、(3)步,然后看輸出的P值是否小于顯著水平?jīng)Q定是否拒絕原假設(shè),假設(shè)檢驗(yàn)例,將旅客對(duì)機(jī)場的評(píng)價(jià)分為10級(jí),7級(jí)以上為高服務(wù)質(zhì)量。隨機(jī)抽取12名旅客對(duì)某機(jī)場的評(píng)級(jí),分別為7、8、10、8、6、9、6、7、7、8、9、8。檢驗(yàn)該機(jī)場是否為高服務(wù)質(zhì)量?,假設(shè)檢驗(yàn)例(續(xù)),(1)確定檢驗(yàn)樣本均值(2)確定原假設(shè)和備擇假設(shè)(3)確定顯著水平為5%(4)查表得t分布的臨界值(5)將樣本均值換算成標(biāo)準(zhǔn)化的t值(6)要檢驗(yàn)的統(tǒng)計(jì)量的|t值|>臨界值,所以拒絕原假設(shè)(H0):結(jié)論是:7.75確實(shí)大于7,該機(jī)場是高服務(wù)質(zhì)量,第2節(jié)方差分析,主要點(diǎn)內(nèi)容方差分析的概念組間平方和與組內(nèi)平方和的概念如何判斷方差分析的結(jié)果,什么是方差分析?,方差分析(ANOVA)的定義在相同方差假定下,檢驗(yàn)多組正態(tài)樣本的均值是否相等的一種統(tǒng)計(jì)分析方法方差分析的基本概念因子:實(shí)驗(yàn)中會(huì)改變狀態(tài)的因素因子的水平:因子的狀態(tài)方差分析的應(yīng)用例兩種抗生素對(duì)某種疾病的療效是否相同?某軟件的升級(jí)版是否比原版運(yùn)行速度更快?三個(gè)工廠生產(chǎn)的零件是否強(qiáng)度相同?(單因子:工廠;三個(gè)工廠?該因子有三個(gè)水平),單因素方差分析的統(tǒng)計(jì)模型,模型的假定:因子A有r個(gè)水平,在第i水平下對(duì)要檢驗(yàn)的指標(biāo)作m次相互獨(dú)立的觀察,獲得關(guān)于總體i的一個(gè)樣本假定總體i服從均值為,方差為的正態(tài)分布模型要檢驗(yàn)的問題:模型檢驗(yàn)的結(jié)論:檢驗(yàn)結(jié)果為F分布的值及其P值。一般將顯著水平設(shè)為0.05,則當(dāng)P≤0.05時(shí),拒絕H0,即r個(gè)水平不全相同;當(dāng)P>0.05時(shí),接受H0,即r個(gè)水平全部相同。,單因素方差分析原理(1),假定:因子A有r個(gè)水平,在第i水平下對(duì)要檢驗(yàn)的指標(biāo)作m次相互獨(dú)立的觀察,獲得關(guān)于總體i的一個(gè)樣本。則共有個(gè)觀察值總離差平方和為,總離差的兩個(gè)來源:組間平方和與組內(nèi)平方和組間平方和,即每個(gè)水平的均值與總均值的離差的平方和組內(nèi)平方和,即每個(gè)水平內(nèi),各觀察值之間的離差的平方和,視為隨機(jī)取樣的誤差總方差和兩個(gè)來源的關(guān)系,單因素方差分析原理(2),如何判斷各個(gè)水平下的均值是否相等?對(duì)組間平方和SA與組內(nèi)平方和Se分別作自由度調(diào)整將調(diào)整后的組間平方和SA與組內(nèi)平方和Se相除,該比值服從F分布F值>1,表示組間的差距>組內(nèi)的隨機(jī)差距,各組數(shù)據(jù)可能有質(zhì)的區(qū)別,均值相等的可能性較小根據(jù)F分布值的P值大小即可判斷均值是否相等:P值≤0.05,檢驗(yàn)結(jié)果顯著,拒絕H0,即不全相等;P值>0.05為接受H0全相等,單因素方差分析原理(3),使用EViews軟件作單因素方差分析例(1),某銀行規(guī)定VIP客戶的月均賬戶余額要達(dá)到100萬元,并以此作為比較各分行業(yè)績的一項(xiàng)指標(biāo)?,F(xiàn)從三個(gè)分行(A1、A2、A3)中,分別隨機(jī)抽取4個(gè)VIP客戶賬戶,用單因素方差分析判斷三個(gè)分行此項(xiàng)業(yè)績指標(biāo)是否相同。,例續(xù)1:EViews數(shù)據(jù)表,定義三個(gè)分行變量,分別輸入4個(gè)賬戶余額,得數(shù)據(jù)表,例續(xù)2:三個(gè)分行賬戶余額的均值,求隨機(jī)變量的均值等基本統(tǒng)計(jì)量:菜單View?DescriptiveStats?CommonSample,例續(xù)3:作方差分析選菜單View?TestofEquality,,例續(xù)4:檢驗(yàn)結(jié)論,顯然方差分析的F分布值的P值=0.0001<0.05,拒絕H0,即三個(gè)分行VIP賬戶余額不全相同。,使用EViews軟件作單因素方差分析的詳細(xì)結(jié)果,Sourceofvariation:離差來源Between:組間平方和Within:組內(nèi)平方和Total:總平方和,,df:自由度,,方差分析例:工資(1),從美國勞工部的統(tǒng)計(jì)中,選出兩個(gè)職業(yè)男、女周工資數(shù)據(jù),分別分析兩個(gè)職業(yè)的男女工資差異,方差分析例:工資(2),各變量的基本統(tǒng)計(jì)量表兩種職業(yè)的男平均工資均大于女平均工資財(cái)務(wù)管理男平均工資高出較大,方差分析例:工資(3),財(cái)務(wù)管理職業(yè)男女工資差別方差分析的檢驗(yàn)假設(shè)H0:財(cái)務(wù)管理職業(yè)男女平均工資相等H1:財(cái)務(wù)管理職業(yè)男女平均工資不相等方差分析的檢驗(yàn)結(jié)果F值22.84,p值0.001F值22.84,男女組間差距是各自組內(nèi)差距的20倍以上。p值0.001,遠(yuǎn)遠(yuǎn)小于5%的顯著水平(即非常顯著),故拒絕H0,男女平均工資不相等,或者說男女平均工資差異大于抽樣誤差,方差分析例:工資(4),計(jì)算機(jī)程序員職業(yè)男女工資差別方差分析的檢驗(yàn)假設(shè)H0:計(jì)算機(jī)程序員職業(yè)男女平均工資相等H1:計(jì)算機(jī)程序員職業(yè)男女平均工資不相等方差分析的檢驗(yàn)結(jié)果F值0.99,p值0.35F值0.99,男女組間差距比各自組內(nèi)差距還小。p值0.35,遠(yuǎn)遠(yuǎn)大于5%的顯著水平(非常不顯著),不能拒絕H0,所以男女平均工資相等,差距來自抽樣誤差,第3節(jié)方差分析應(yīng)用:恩格爾系數(shù)的城鄉(xiāng)比較,主要內(nèi)容恩格爾系數(shù)的概念對(duì)我國近年城鄉(xiāng)恩格爾系數(shù)的方差分析,有關(guān)居民消費(fèi)結(jié)構(gòu)的恩格爾系數(shù),恩格爾系數(shù)(EngelsCoefficient)反映如下規(guī)律收入越少,食品支出占總消費(fèi)支出的比率越高,恩格爾系數(shù)越大隨著國民經(jīng)濟(jì)的增長,恩格爾系數(shù)呈下降趨勢國際標(biāo)準(zhǔn)根據(jù)聯(lián)合國糧農(nóng)組織提出的標(biāo)準(zhǔn),恩格爾系數(shù)在59%以上為貧困,50-59%為溫飽,40-50%為小康,30-40%為富裕,低于30%為最富裕。,我國近年恩格爾系數(shù)(表),聯(lián)合國糧農(nóng)組織的標(biāo)準(zhǔn),我國城鎮(zhèn)居民的系數(shù)在30-40%之間,為富裕水平;農(nóng)村居民的系數(shù)在40-50%,為小康水平近年農(nóng)村居民的恩格爾系數(shù)下降較為明顯,我國近年恩格爾系數(shù)(圖),總體趨勢是下降,但有波動(dòng)。主要原因是農(nóng)產(chǎn)品價(jià)格波動(dòng)農(nóng)村居民恩格爾系數(shù)“悖論”:農(nóng)產(chǎn)品價(jià)格上升?收入增加?食品消費(fèi)支出增加?恩格爾系數(shù)不變,城鄉(xiāng)恩格爾系數(shù)的方差分析(均值),,分析假設(shè):H0:城鎮(zhèn)和農(nóng)村恩格爾系數(shù)的均值相等H1:城鎮(zhèn)和農(nóng)村恩格爾系數(shù)的均值不相等分析結(jié)論:F分布的值在0.05水平顯著(P值0.05)?接受H0的假設(shè)?城鎮(zhèn)和農(nóng)村恩格爾系數(shù)的方差相等,恩格爾系數(shù)的標(biāo)準(zhǔn)差:城鎮(zhèn)為6.77;農(nóng)村為6.05,所以表面看農(nóng)村系數(shù)下降較快,實(shí)質(zhì)上,城鄉(xiāng)系數(shù)變化幅度是相當(dāng)?shù)?- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 金融 統(tǒng)計(jì) 03 假設(shè)檢驗(yàn) 方差分析
鏈接地址:http://m.appdesigncorp.com/p-3278842.html