《新版高中數學北師大版必修三教學案:第一章167;8 最小二乘估計 Word版含答案》由會員分享,可在線閱讀,更多相關《新版高中數學北師大版必修三教學案:第一章167;8 最小二乘估計 Word版含答案(11頁珍藏版)》請在裝配圖網上搜索。
1、新版數學北師大版精品資料
[核心必知]
1.回歸直線
如果兩個變量散點圖中點的分布從整體上看大致在一條直線附近,那么稱這兩個變量之間具有線性相關關系,這條直線叫作回歸直線.
2.最小二乘法
求線性回歸方程y=bx+a時,使得樣本數據的點到它的距離的平方和最小的方法叫作最小二乘法.其中a,b的值由以下公式給出:
a,b是線性回歸方程的系數.
[問題思考]
1.任給一組數據,我們都可以由最小二乘法得出線性回歸方程嗎?
提示:用最小二乘法求回歸直線的方程的前提是先判斷所給數據具有線性相關關系(可利用散點圖判斷).否則求出的線性回歸方程是無意義的.
2.線性回歸方程是否經
2、過一定點?
提示:線性回歸方程恒過定點(,).
講一講
1.下表是某旅游區(qū)游客數量與平均氣溫的對比表:
平均氣溫(℃)
-1
4
10
13
18
26
數量(百個)
20
24
34
38
50
64
若已知游客數量與平均氣溫是線性相關的,求線性回歸方程.
[嘗試解答] ==,==,
x+x+…+x=1+16+100+169+324+676=1 286,
x1y1+x2y2+…+x6y6=-20+96+340+1338+1850+2664=3 474.
b==≈1.68,
a=-b≈18.73,
即所求的線性回歸方程為y=1.6
3、8x+18.73.
求線性回歸方程的步驟
(1)畫出散點圖,判斷其具有相關關系;
(2)計算,,x=x+x+…+x,
xiyi=x1y1+x2y2+…+xnyn.
(3)代入公式b=,a=-b;
(4)寫出線性回歸方程y=bx+a.
練一練
1.某研究機構對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,得下表數據:
x
6
8
10
12
y
2
3
5
6
已知記憶力x和判斷力y是線性相關的,求線性回歸方程.
解:==9,==4,
a=-b=4-0.79=-2.3.
則所求的線性回歸方程為y=0.7x-2.3.
講一講
2.某種產品
4、的廣告費支出x(單位:百萬元)與銷售額y(單位:百萬元)之間有如下對應數據:
x
2
4
5
6
8
y
30
40
60
50
70
(1)畫出散點圖;
(2)求線性回歸方程;
(3)預測當廣告費支出為7百萬元時的銷售額.
[嘗試解答] (1)
(2)從散點圖可以發(fā)現(xiàn),y與x具有線性相關關系,利用計算器求得:
=5,=50,x=145,xiyi=1 380,
設回歸方程為y=bx+a,則
b===6.5,
a=-b=50-6.55=17.5,故所求線性回歸方程為y=6.5x+17.5.
(3)當x=7時,y=6.57+17.5=63.
所
5、以,當廣告費支出為7百萬元時,銷售額約為6 300萬元.
用線性回歸方程估計總體的一般步驟:
(1)作出散點圖,判斷散點是否在一條直線附近;
(2)如果散點在一條直線附近,用公式求出a、b并寫出線性回歸方程;
(3)根據線性回歸方程對總體進行估計.
練一練
2.假設關于某設備的使用年限x和所支出的維修費用y(單位:萬元)有如下的統(tǒng)計資料:
使用年限x
2
3
4
5
6
維修費用y
2.2
3.8
5.5
6.5
7.0
若由資料知y對x呈線性相關關系,試求:
(1)回歸方程y=bx+a的系數a,b;
(2)使用年限為10年時,試估計維修費用是多少
6、.
解:(1)列表如下:
I
1
2
3
4
5
xi
2
3
4
5
6
yi
2.2
3.8
5.5
6.5
7.0
xiyi
4.4
11.4
22.0
32.5
42.0
x
4
9
16
25
36
=4,=5,x=90,xiyi=112.3
b===1.23,
a=-b=5-1.234=0.08.
(2)回歸方程是y=1.23x+0.08,
當x=10時,y=1.2310+0.08=12.38(萬元),
即估計使用10年時維修費用是12.38萬元.
【解題高手】【易錯題】
有人統(tǒng)計了同一個省的6個城市
7、某一年的人均國民生產總值(即人均GDP)和這一年各城市患白血病的兒童數量,如下表:
人均GDP(萬元)
10
8
6
4
3
1
患白血病的兒童數
351
312
207
175
132
180
(1)畫出散點圖,并判定兩個變量是否具有線性相關關系;
(2)通過計算可得兩個變量的線性回歸方程為y=23.25x+102.25,假如一個城市的人均GDP為12萬元,那么可以斷言,這個城市患白血病的兒童一定超過380人,請問這個斷言是否正確?
[錯解] (1)根據表中數據畫散點圖,如圖所示,從圖可以看出,雖然后5個點大致分布在一條直線的附近,但第一個點離這條直線太遠,
8、所以這兩個變量不具有線性相關關系.
(2)將x=12代入y=23.25x+102.25,得y=23.2512+102.25=381.25>380,所以上述斷言是正確的.
[錯因] 在第(1)問中,是否具有線性相關關系,要看大部分點、主流點是否分布在一條直線附近,個別點是不影響“大局”的,所以可斷定這兩個變量具有線性相關關系.在第(2)問中,381.25只是一個估計值,由它不能斷言這個城市患白血病的兒童一定超過380人.如果這個城市的污染很嚴重,有可能人數遠遠超過380,若這個城市的環(huán)境保護的很好,則人數就有可能遠遠低于380.
[正解] (1)根據表中數據畫散點圖,如錯解圖所示,從圖
9、可以看出,在6個點中,雖然第一個點離這條直線較遠,但其余5個點大致分布在這條直線的附近,所以這兩個變量具有線性相關關系.
(2)將x=12代入y=23.25x+102.25,得y=23.2512+102.25=381.25>380,即便如此,但因381.25只是一個估計值,會受其他情況的影響,所以不能斷言這個城市患白血病的兒童一定超過380人.
1.已知x與y之間的一組數據:
x
0
1
2
3
y
1
3
5
7
則y與x的線性回歸方程y=bx+a必過點( )
A.(2,2) B.(1.5,0) C.(1,2) D.(1.5,4)
解析:選
10、D ==1.5,==4.
2.工人工資y(元)隨勞動生產率x(千元)變化的回歸直線方程為y=80x+50,則下列判斷正確的是( )
A.勞動生產率為1 000元時,工資為130元
B.勞動生產率提高1 000元時,工資約提高80元
C.勞動生產率提高1 000元時,工資約提高130元
D.當月工資210元時,勞動生產率為2 000元
解析:選B 回歸直線的斜率為80,所以x每增加1個單位,y約增加80,即勞動生產率提高1 000元時,工資提高約80元.
3.(福建高考改編)已知x與y之間的幾組數據如下表:
x
1
2
3
4
5
6
y
0
2
1
11、
3
3
4
假設根據上表數據所得線性回歸直線方程為y=bx+a,若某同學根據上表中的前兩組數據(1,0)和(2,2)求得的直線方程為y=b′x+a′,則以下結論正確的是( )
A.b>b′,a>a′ B.b>b′,aa′ D.ba′.
4.某商店統(tǒng)計了最近6個月某商品的進價x與售價y(單位:元)的對應數據如下:
x
3
5
2
12、
8
9
12
y
4
6
3
9
12
14
則=________,=________,=________,
=________,回歸方程為________.
解析:根據公式代入即可求得,也可以利用計算器求得=6.5,=8,=327,=396,
回歸方程為y=1.14x+0.59.
答案:6.5 8 327 396 y=1.14x+0.59
5.某單位為了了解用電量y度與氣溫x℃之間的關系,隨機統(tǒng)計了某4天的用電量與當天氣溫,并制作了對照表:
氣溫(℃)
18
13
10
-1
用電量(度)
24
34
38
64
由表中數據得線性回歸方程
13、y=bx+a中b=-2,預測當氣溫為-4 ℃時,用電量的度數約為________.
解析:==10,==40,則a=-b =40+210=60,則y=-2x+60,則當x=-4時,y=-2(-4)+60=68.
答案:68
6.下表提供了某廠節(jié)能降耗技術改造后,生產甲產品過程中記錄的產量x(噸)與相應的生產能耗y(噸標準煤)的幾組對照數據:
x
3
4
5
6
y
2.5
3
4
4.5
(1)請畫出上表中數據的散點圖;
(2)請根據上表提供的數據,用最小二乘法求出y關于x的線性回歸方程y=bx+a;
(3)已知該廠技改前100噸甲產品的生產能耗為90噸標準
14、煤.試根據(2)求出的線性回歸方程,預測生產100噸甲產品的生產能耗比技改前降低多少噸標準煤.(參考數值:32.5+43+54+64.5=66.5)
解:(1)散點圖如圖所示.
(2)由對照數據,計算得:
x=86,==4.5,==3.5.
又已知xiyi=66.5,
∴b===0.7,
a=-b=3.5-0.74.5=0.35.
∴所求的線性回歸方程為y=0.7x+0.35.
(3)90-(0.7100+0.35)=19.65(噸標準煤),
故預測生產100噸甲產品的生產能耗比技改前降低約19.65噸標準煤.
一、選擇題
1.設有一個回歸方程y=2-1.5x,當
15、x增加1個單位時( )
A.y平均增加1.5個單位 B.y平均減少1.5個單位
C.y平均增加2個單位 D.y平均減少2個單位
解析:選B y′=2-1.5(x+1)=2-1.5x-1.5=y(tǒng)-1.5,即x增加1個單位,y平均減少1.5個單位.
2.對有線性相關關系的兩個變量建立的線性回歸方程y=a+bx中,回歸系數b( )
A.可以小于0 B.只能大于0
C.只能等于0 D.只能小于0
解析:選A ∵b=,∴b的取值是任意的.
3.由一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)得到線性回歸方程y=bx+a,那么下面說法不正確的是( )
16、
A.直線y=bx+a必經過點(,)
B.直線y=bx+a至少經過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點
C.直線y=bx+a的斜率為
D.直線y=bx+a與各點(x1,y1),(x2,y2),…,(xn,yn)的接近程度[yi-(bxi+a)]2是該坐標平面上所有直線與這些點的最接近的直線
解析:選B 直線y=bx+a一定過點(,),但不一定要過樣本點.
4.(湖南高考)設某大學的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關關系,根據一組樣本數據(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為=0.85x-85.71,則下列
17、結論中不正確的是( )
A.y與x具有正的線性相關關系
B.回歸直線過樣本點的中心(,)
C.若該大學某女生身高增加1 cm,則其體重約增加0.85 kg
D.若該大學某女生身高為170 cm,則可斷定其體重必為58.79 kg
解析:選D 當x=170時,=0.85170-85.71=58.79,體重的估計值為58.79 kg,故D不正確.
5.(山東高考)某產品的廣告費用x與銷售額y的統(tǒng)計數據如下表:
廣告費用x(萬元)
4
2
3
5
銷售額y(萬元)
49
26
39
54
根據上表可得回歸方程y=bx+a中的b為9.4,據此模型預報廣告費用為6萬
18、元時銷售額為( )
A.63.6萬元 B.65.5萬元
C.67.7萬元 D.72.0萬元
解析:選B 容易計算得=3.5,=42,故a=-b=42-9.43.5=9.1,所以當廣告費用為6萬元時銷售額為9.46+9.1=65.5(萬元).
二、填空題
6.(遼寧高考改編)調查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元).調查顯示年收入x與年飲食支出y具有線性相關關系,并由調查數據得到y(tǒng)對x的回歸直線方程:y=0.254x+0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加________萬元.
解析:由回歸直線方程的意義知,
19、x每增加1萬元,y平均增加0.254萬元.
答案:0.254
7.對一質點的運動過程觀測了4次,得到如表所示的數據,則刻畫y與x的關系的線性回歸方程為________.
x
1
2
3
4
y
1
3
5
6
解析:=2.5,=3.75,xiyi=46,x=30,
b==1.7,a=-b=-0.5,
所以所求的線性回歸方程為:y=1.7x-0.5.
答案:y=1.7x-0.5
8.(廣東高考)為了解籃球愛好者小李的投籃命中率與打籃球時間之間的關系,下表記錄了小李某月1號到5號每天打籃球時間x(單位:小時)與當天投籃命中率y之間的關系:
時間x
1
2
20、
3
4
5
命中率y
0.4
0.5
0.6
0.6
0.4
小李這5天的平均投籃命中率為________;用線性回歸分析的方法,預測小李該月6號打6小時籃球的投籃命中率為________.
解析:小李這5天的平均投籃命中率為(0.4+0.5+0.6+0.6+0.4)5=0.5.
又=3,=0.5,
由表中數據,得b=0.01,
a=-b=0.47,
故回歸直線方程為y=0.01x+0.47.
令x=6,則有y=0.016+0.47=0.53.
答案:0.5 0.53
三、解答題
9.在7塊并排、形狀大小相同的試驗田上進行施化肥量對水稻產量(單位:千
21、克)影響的試驗,得到如下一組數據:
施化肥量
15
20
25
30
35
40
45
水稻產量
330
345
365
405
445
450
455
(1)作出這些數據的散點圖;
(2)由(1)分析兩變量關系得出什么結論?
(3)求出回歸直線方程.
解:(1)如圖所示.
(2)由(1)可看出,各點散布在從左下角到右上角的區(qū)域內,為正相關,也可以說在適量限制范圍內水稻產量隨施肥量的增大而增大,但不是直線遞增.
(3)用科學計算器可求得=30,=399.3,x=7 000,xiyi=87 175.于是b==
≈4.75.a=-b=399.3
22、-4.7530≈257.因此所求回歸直線方程為y=4.75x+257.
10.(福建高考改編)某工廠為了對新研發(fā)的一種產品進行合理定價,將該產品按事先擬定的價格進行試銷,得到如下數據:
單價x(元)
8
8.2
8.4
8.6
8.8
9
銷量y(件)
90
84
83
80
75
68
(1)求回歸直線方程y=bx+a,其中b=-20,a=-b;
(2)預計在今后的銷售中,銷量與單價仍然服從(1)中的關系,且該產品的成本是4元/件,為使工廠獲得最大利潤,該產品的單價應定為多少元?(利潤=銷售收入-成本)
解:(1)由于=(x1+x2+x3+x4+x5+x6)=8.5,
=(y1+y2+y3+y4+y5+y6)=80.
所以a=-b=80+(-20)8.5=250,從而回歸直線方程為y=-20x+250.
(2)設工廠獲得的利潤為L元,依題意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-20(x-)2+361.25.
當且僅當x=8.25時,L取得最大值.
故當單價定為8.25元時,工廠可獲得最大利潤.