《應(yīng)用回歸分析第九章部分答案》由會員分享,可在線閱讀,更多相關(guān)《應(yīng)用回歸分析第九章部分答案(17頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、第9章 非線性回歸
9.1 在非線性回歸線性化時(shí),對因變量作變換應(yīng)注意什么問題?
答:在對非線性回歸模型線性化時(shí),對因變量作變換時(shí)不僅要注意回歸函數(shù)的形式, 還要注意誤差項(xiàng)的形式。如:
(1) 乘性誤差項(xiàng),模型形式為,
(2) 加性誤差項(xiàng),模型形式為。
對乘法誤差項(xiàng)模型(1)可通過兩邊取對數(shù)轉(zhuǎn)化成線性模型,(2)不能線性化。
一般總是假定非線性模型誤差項(xiàng)的形式就是能夠使回歸模型線性化的形式,為了方便通常省去誤差項(xiàng),僅考慮回歸函數(shù)的形式。
9.2為了研究生產(chǎn)率與廢料率之間的關(guān)系,記錄了如表9.14所示的數(shù)據(jù),請畫出散點(diǎn)圖,根據(jù)散點(diǎn)圖的趨勢擬合適當(dāng)?shù)幕貧w模型。
表9.14
生產(chǎn)
2、率x(單位/周)
1000
2000
3000
3500
4000
4500
5000
廢品率y(%)
5.2
6.5
6.8
8.1
10.2
10.3
13.0
解:先畫出散點(diǎn)圖如下圖:
從散點(diǎn)圖大致可以判斷出x和y之間呈拋物線或指數(shù)曲線,由此采用二次方程式和指數(shù)函數(shù)進(jìn)行曲線回歸。
(1)二次曲線
SPSS輸出結(jié)果如下:
從上表可以得到回歸方程為:
由x的系數(shù)檢驗(yàn)P值大于0.05,得到x的系數(shù)未通過顯著性檢驗(yàn)。
由x2的系數(shù)檢驗(yàn)P值小于0.05,得到x2的系數(shù)通過了顯著性檢驗(yàn)。
(2)指數(shù)曲線
從上表可以得到回歸
3、方程為:
由參數(shù)檢驗(yàn)P值≈0<0.05,得到回歸方程的參數(shù)都非常顯著。
從R2值,σ的估計(jì)值和模型檢驗(yàn)統(tǒng)計(jì)量F值、t值及擬合圖綜合考慮,指數(shù)擬合效果更好一些。
9.3 已知變量x與y的樣本數(shù)據(jù)如表9.15,畫出散點(diǎn)圖,試用αeβ/x來擬合回歸模型,假設(shè):
(1) 乘性誤差項(xiàng),模型形式為y=αeβ/xeε
(2) 加性誤差項(xiàng),模型形式為y=αeβ/x+ε。
表9.15
序號
x
y
序號
x
y
序號
x
y
1
4.20
0.086
6
3.20
0.150
11
2.20
0.350
2
4.06
0.090
7
3.00
0.
4、170
12
2.00
0.440
3
3.80
0.100
8
2.80
0.190
13
1.80
0.620
4
3.60
0.120
9
2.60
0.220
14
1.60
0.940
5
3.40
0.130
10
2.40
0.240
15
1.40
1.620
解: 散點(diǎn)圖:
(1) 乘性誤差項(xiàng),模型形式為y=αeβ/xeε
線性化:lny=lnα+β/x +ε 令y1=lny, a=lnα,x1=1/x .
做y1與x1的線性回歸,SPSS輸出結(jié)果如下:
從以上結(jié)果可以得到回歸方程為:y1=-3.8
5、56+6.08x1
F檢驗(yàn)和t檢驗(yàn)的P值≈0<0.05,得到回歸方程及其參數(shù)都非常顯著。
回代為原方程為:y=0.021e6.08/x
(2)加性誤差項(xiàng),模型形式為y=αeβ/x+ε
不能線性化,直接非線性擬合。給初值α=0.021,β=6.08(線性化結(jié)果),NLS結(jié)果如下:
從以上結(jié)果可以得到回歸方程為: y=0.021e6.061/x
根據(jù)R2≈1,參數(shù)的區(qū)間估計(jì)不包括零點(diǎn)且較短,可知回歸方程擬合非常好,且其參數(shù)都顯著。
9.4 Logistic回歸函數(shù)常用于擬合某種消費(fèi)品的擁有率,表8.17(書上239頁,此處略)是北京市每百戶家庭平均擁有的照相機(jī)數(shù),
6、試針對以下兩種情況擬合Logistic回歸函數(shù)。
(1)已知,用線性化方法擬合,
(2)u未知,用非線性最小二乘法擬合。根據(jù)經(jīng)濟(jì)學(xué)的意義知道,u是擁有率的上限,初值可取100;b0>0,0
7、e畫圖:
由圖可知回歸效果比較令人滿意。
(2)非線性最小二乘擬合,取初值,,:
一共循環(huán)迭代8次,得到回歸分析結(jié)果為:
>0.994,得到回歸效果比線性擬合要好,且:,,,
回歸方程為:。
最后看擬合效果,由sequence畫圖:
得到回歸效果很好,而且較優(yōu)于線性回歸。9.5表9.17(書上233頁,此處略)數(shù)據(jù)中GDP和投資額K都是用定基居民消費(fèi)價(jià)格指數(shù)(CPI)縮減后的,以1978年的價(jià)格指數(shù)為100。
(1) 用線性化乘性誤差項(xiàng)模型擬合C-D生產(chǎn)函數(shù);
(2) 用非線性最小二乘擬合加性誤差項(xiàng)模型的C-D生產(chǎn)函數(shù);
(3) 對線性化檢驗(yàn)自相關(guān),如果存在
8、自相關(guān)則用自回歸方法改進(jìn);
(4) 對線性化檢驗(yàn)多重共線性,如果存在多重共線性則用嶺回歸方法改進(jìn);
解:(1)對乘法誤差項(xiàng)模型可通過兩邊取對數(shù)轉(zhuǎn)化成線性模型。
lny=lnA+ a lnK+ b lnL
令y′=lny,β0=lnA,x1=lnK,x2=lnL,則轉(zhuǎn)化為線性回歸方程:
y′=β0+ a x1+ b x2+ e
SPSS輸出結(jié)果如下:
模型綜述表
從模型綜述表中可以看到,調(diào)整后的為0.993,說明C-D生產(chǎn)函數(shù)擬合效果很好,也說明GDP的增長是一個(gè)指數(shù)模型。
方差分析表
從方差分析表中可以看到,F(xiàn)值很大,P值為零,說明模型通過了檢驗(yàn),這與
9、上述分析結(jié)果一致。
系數(shù)表
根據(jù)系數(shù)表顯示,回歸方程為:
盡管模型通過了檢驗(yàn),但是也可以看到,常數(shù)項(xiàng)沒有通過檢驗(yàn),但在這個(gè)模型里,當(dāng)lnK和lnL都為零時(shí),lnY為-1.785,即當(dāng)K和L都為1時(shí),GDP為0.168,也就是說當(dāng)投入資本和勞動力都為1個(gè)單位時(shí),GDP將增加0.168個(gè)單位,這種解釋在我們的承受范圍內(nèi),可以認(rèn)為模型可以用。
最終方程結(jié)果為:
y=0.618K0.801 L0.404
(2) 用非線性最小二乘法擬合加性誤差項(xiàng)模型的C-D生產(chǎn)函數(shù);
上述假設(shè)誤差是乘性的,現(xiàn)假設(shè)誤差是加性的情況下使用非線性最小二乘法估計(jì)。初值采用(1)中參數(shù)的結(jié)果
10、,SPSS輸出結(jié)果如下:
參數(shù)估計(jì)表
SPSS經(jīng)過多步迭代,最終得到的穩(wěn)定參數(shù)值為P=0.407,a=0.868,b=0.270
y=0.407K0.868 L0.270
為了比較這兩個(gè)方程,我們觀察下面兩個(gè)圖
線性回歸估計(jì)擬合曲線圖
非線性最小二乘估計(jì)擬合曲線圖
我們知道,乘性誤差相當(dāng)于是異方差的,做了對數(shù)變換后,乘性誤差轉(zhuǎn)為加性誤差,這種情況下認(rèn)為方差是相等的,那么第一種情況(對數(shù)變換線性化)就大大低估了GDP數(shù)值大的項(xiàng),因此,它對GDP前期擬合的很好,而在后期偏差就變大了,同時(shí)也會受到自變量之間的自相關(guān)和多重共線性的綜合影響;非線性最小二乘法完全依賴
11、數(shù)據(jù),如果自變量之間存在比較嚴(yán)重的異方差、自相關(guān)以及多重共線性,將對擬合結(jié)果造成很大的影響。因此,不排除異方差、自相關(guān)以及多重共線性的存在。
(3) 對線性化回歸模型采用DW檢驗(yàn)自相關(guān),結(jié)果如下:
模型綜述表
DW=0.715<1.27,落在自相關(guān)的區(qū)間,所以采用迭代法改進(jìn)
將得到的數(shù)據(jù)再取對數(shù),而后用普通最小二乘法估計(jì),保留DW值
模型綜述表
方差分析表
系數(shù)表
從模型綜述表中可以看到,DW=1.618>1.45,認(rèn)為消除了自相關(guān);方差分析表中可以看到F值很大,P值為零,說明模型通過了檢驗(yàn)。
從系數(shù)表可得回歸
12、方程:
再迭代回去,最終得方程為:
Lnyt-Lnyt-1=-1.859+0.755(LnKt-LnKt-1) +0.465(LnLt-LnLt-1)
(4) 對線性化回歸方程通過VIF檢驗(yàn)多重共線性:
方差分析表
系數(shù)表
多重共線性診斷表
直觀法:從模型綜述表上可以看到,F(xiàn)值很大,而t值很小,這是多重共線性造成的影響;
VIF檢驗(yàn)法:從系數(shù)表上可以看到,VIF=13>10,也說明多重共線性的存在;
條件數(shù):從診斷表上可以看到,最大的條件數(shù)是429,遠(yuǎn)遠(yuǎn)大于了100,所以自變量之間存在較為嚴(yán)重的多重共線性。
利用嶺回歸改進(jìn)
13、:
R-SQUARE AND BETA COEFFICIENTS FOR ESTIMATED VALUES OF K
K RSQ LNK LNL
______ ______ ________ ________
.00000 .99394 .860706 .141014
.05000 .99015 .646381 .330432
.10000 .98639 .577758 .375355
.15000 .98
14、260 .539715 .390822
.20000 .97843 .513383 .395623
.25000 .97379 .492922 .395526
.30000 .96869 .475918 .392882
.35000 .96318 .461184 .388818
.40000 .95730 .448063 .383937
.45000 .95109 .436158 .378587
.50000 .94462
15、 .425211 .372979
.55000 .93791 .415047 .367248
.60000 .93101 .405541 .361481
.65000 .92395 .396598 .355735
.70000 .91677 .388147 .350049
從嶺跡圖觀察,當(dāng)k=0.2時(shí),變量基本趨于穩(wěn)定
取k=0.2進(jìn)行嶺回歸, SPSS輸出結(jié)果為:α=0.479,β=1.127
從嶺回歸給出的結(jié)果來看,說明勞動力L較資金K對GDP的影響較大,而我國屬于人口大國,就業(yè)人數(shù)對GDP的貢獻(xiàn)不一定有顯著的影響,相反,資金對GDP的影響按常理來說是非常顯著的,這點(diǎn)普通最小二乘法給出了合理的解釋,但是,嶺回歸在理論上很可信的。總之,影響統(tǒng)計(jì)的因素有很多,例如統(tǒng)計(jì)員的失誤、國家政策等,造成函數(shù)系數(shù)的不穩(wěn)定。