2018-2019學年高中數(shù)學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2.docx
《2018-2019學年高中數(shù)學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2.docx》由會員分享,可在線閱讀,更多相關(guān)《2018-2019學年高中數(shù)學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2.docx(19頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1.1 回歸分析的基本思想及其初步應用 學習目標 1.了解回歸分析的必要性及其一般步驟.2.了解隨機誤差的概念.3.會作散點圖,并會求線性回歸方程.4.利用殘差分析來判斷線性回歸模型的擬合效果.5.掌握建立回歸模型的基本步驟,并通過實例進一步學習回歸分析的基本思想及其初步應用. 知識點一 回歸分析的相關(guān)概念 思考1 相關(guān)關(guān)系是確定性關(guān)系嗎?函數(shù)關(guān)系呢? 答案 相關(guān)關(guān)系是一種非確定性關(guān)系,而函數(shù)關(guān)系是一種確定性關(guān)系. 思考2 請問產(chǎn)生隨機誤差的主要原因有哪些? 答案 (1)所選用的模型不恰當;(2)忽略了某些因素的影響;(3)存在測量誤差. 梳理 (1)回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法.若兩個變量之間具有線性相關(guān)關(guān)系,則稱相應的回歸分析為線性回歸分析. (2)線性回歸方程為=x+,且=,=-,其中=i,=i,(,)稱為樣本點的中心,回歸直線一定過樣本點的中心. (3)樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a來描述它們之間的關(guān)系,而是用線性回歸模型y=bx+a+e來表示,其中a和b為模型的未知參數(shù),e稱為隨機誤差,自變量x稱為解釋變量,因變量y稱為預報變量. 預報變量y的值由解釋變量x和隨機誤差e共同確定,即解釋變量x只能解釋部分預報變量y的變化. 知識點二 回歸模型的模擬效果 思考 如何評價回歸模型擬合效果的優(yōu)劣? 答案 計算相關(guān)指數(shù)R2的值,R2越接近于1,效果就越好. 梳理 殘差 把隨機誤差的估計值i稱為相應于點(xi,yi)的殘差 殘差圖 作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或解釋變量的數(shù)值,這樣作出的圖形稱為殘差圖 殘差 圖法 殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高 殘差平方和 殘差平方和為(yi-i)2,殘差平方和越小,模型的擬合效果越好 相關(guān)指數(shù)R2 R2=1-,R2表示解釋變量對于預報變量變化的貢獻率,R2越接近于1,表示回歸的效果越好 1.回歸方程=x+中的表示當x每增加一個單位時,的變化量.( √ ) 2.R2越大,殘差平方和越小,即模型的擬合效果越好;R2越小,殘差平方和越大,即模型的擬合效果越差.( √ ) 3.散點圖是判斷兩個變量是否有相關(guān)關(guān)系的工具之一.( √ ) 4.在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有點(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為1.( √ ) 5.回歸直線=x+不一定過點(,).( ) 類型一 線性回歸方程的求解 例1 現(xiàn)有某高新技術(shù)企業(yè)年研發(fā)費用投入x(百萬元)與企業(yè)年利潤y(百萬元)之間具有線性相關(guān)關(guān)系,近5年的年科研費用和年利潤具體數(shù)據(jù)如下表: 年科研費用x(百萬元) 1 2 3 4 5 企業(yè)所獲利潤y(百萬元) 2 3 4 4 7 (1)畫出散點圖; (2)求y對x的線性回歸方程. 考點 回歸分析 題點 建立回歸模型的基本步驟 解 (1)散點圖如下圖所示: (2)由題意可知,==3, ==4, iyi=12+23+34+44+57=71, =12+22+32+42+52=55, 根據(jù)公式,可求得==1.1, =4-1.13=0.7, 故所求線性回歸方程為=1.1x+0.7. 引申探究 在例1基礎上,試估計當x=10時,企業(yè)所獲利潤為多少? 解 依上例得=1.1x+0.7, 將x=10代入,得=11.7(百萬元). 故估計企業(yè)所獲利潤為11.7百萬元. 反思與感悟 (1)求線性回歸方程的基本步驟 ①列出散點圖,從直觀上分析數(shù)據(jù)間是否存在線性相關(guān)關(guān)系. ②計算:,,,iyi. ③代入公式求出=x+中參數(shù),的值. ④寫出線性回歸方程并對實際問題作出估計. (2)需特別注意的是,只有在散點圖大致呈線性時,求出的回歸方程才有實際意義,否則求出的回歸方程毫無意義. 跟蹤訓練1 假設關(guān)于某設備的使用年限x(年)和所支出的維修費用y(萬元)有如下的統(tǒng)計數(shù)據(jù): x 2 3 4 5 6 y 2.2 3.8 5.5 6.5 7.0 由此資料可知y對x呈線性相關(guān)關(guān)系. (1)求線性回歸方程; (2)求使用年限為10年時,該設備的維修費用為多少? 考點 線性回歸方程 題點 求線性回歸方程 解 (1)由上表中的數(shù)據(jù)可得 =4,=5,=90,iyi=112.3, ∴===1.23, ∴=-=5-1.234=0.08. ∴線性回歸方程為=1.23x+0.08. (2)當x=10時,=1.2310+0.08=12.38. 即使用年限為10年時,該設備的維修費用為12.38萬元. 類型二 回歸模型的效果 例2 某運動員訓練次數(shù)與運動員成績之間的數(shù)據(jù)關(guān)系如下: 編號 1 2 3 4 5 6 7 8 次數(shù)(x) 30 33 35 37 39 44 46 50 成績(y) 30 34 37 39 42 46 48 51 (1)作出散點圖; (2)求出線性回歸方程; (3)作出殘差圖,并說明模型的擬合效果; (4)計算R2,并說明其含義. 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的應用 解 (1)該運動員訓練次數(shù)(x)與成績(y)之間的散點圖如圖所示. (2)可求得=39.25,=40.875,=12656,iyi=13180, ∴==≈1.0415, =-=-0.003875, ∴線性回歸方程為=1.0415x-0.003875. (3)作殘差圖如圖所示, 由圖可知,殘差點比較均勻地分布在水平的帶狀區(qū)域中,說明選用的模型比較合適. (4)R2=1-=0.9855,說明了該運動員成績差異有98.55%是由訓練次數(shù)引起的. 反思與感悟 (1)該類題屬于線性回歸問題,解答本題應先通過散點圖來分析兩變量間的關(guān)系是否線性相關(guān),然后再利用求回歸方程的公式求解回歸方程,并利用殘差圖或相關(guān)指數(shù)R2來分析函數(shù)模型的擬合效果,在此基礎上,借助回歸方程對實際問題進行分析. (2)刻畫回歸效果的三種方法 ①殘差圖法,殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模型比較合適. ②殘差平方和法:殘差平方和(yi-i)2越小,模型的擬合效果越好. ③相關(guān)指數(shù)法:R2=1-越接近1,表明回歸的效果越好. 跟蹤訓練2 (1)甲、乙、丙、丁4位同學各自對A,B兩變量進行回歸分析,分別得到散點圖與殘差平方和(yi-i)2如下表: 甲 乙 丙 丁 散點圖 殘差平方和 115 106 124 103 則________同學的試驗結(jié)果體現(xiàn)擬合A,B兩變量間關(guān)系的模型的擬合效果最好. 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的應用 答案 丁 解析 殘差平方和越小,模型的擬合效果越好,因丁對應的殘差平方和最小,故丁所對應的模型擬合效果最好. (2)關(guān)于x與y有如下數(shù)據(jù): x 2 4 5 6 8 y 30 40 60 50 70 現(xiàn)有兩個線性模型:(1)=6.5x+17.5;(2)=7x+17.試比較哪一個擬合效果更好. 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的應用 解 由(1)可得yi-i與yi-的關(guān)系如下表: yi-i -0.5 -3.5 10 -6.5 0.5 yi- -20 -10 10 0 20 ∴(yi-i)2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.52=155, (yi-)2=(-20)2+(-10)2+102+02+202=1000. ∴R=1-=1-=0.845. 由(2)可得yi-i與yi-的關(guān)系如下表: yi-i -1 -5 8 -9 -3 yi- -20 -10 10 0 20 ∴(yi-i)2=(-1)2+(-5)2+82+(-9)2+(-3)2=180, (yi-)2=(-20)2+(-10)2+102+02+202=1000. ∴R=1-=1-=0.82. 由于R=0.845,R=0.82,0.845>0.82, ∴R>R. ∴(1)的擬合效果好于(2)的擬合效果. 1.設回歸方程為=7-3x,當變量x增加兩個單位時( ) A.y平均增加3個單位 B.y平均減少3個單位 C.y平均增加6個單位 D.y平均減少6個單位 考點 線性回歸分析 題點 回歸直線的概念 答案 D 解析 因為兩個相關(guān)變量為負相關(guān)關(guān)系. 2.已知x與y之間的一組數(shù)據(jù): x 0 1 2 3 y 1 3 5 7 則y與x的線性回歸方程=x+必過點( ) A.(2,2) B.(1,2) C.(1.5,0) D.(1.5,4) 考點 線性回歸方程 題點 樣本點中心的性質(zhì) 答案 D 解析 過樣本點中心. 3.在回歸分析中,相關(guān)指數(shù)R2的值越大,說明殘差平方和( ) A.越大 B.越小 C.可能大也可能小 D.以上均不正確 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的概念 答案 B 解析 因為R2=1-, 所以當R2越大時,(yi-i)2越小, 即殘差平方和越小,故選B. 4.某學生課外活動興趣小組對兩個相關(guān)變量收集到5組數(shù)據(jù)如表: x 10 20 30 40 50 y 62 ■ 75 81 89 由最小二乘法求得回歸方程為=0.67x+54.9,現(xiàn)發(fā)現(xiàn)表中有一個數(shù)據(jù)模糊不清,請推斷該點數(shù)據(jù)的值為________. 考點 線性回歸方程 題點 樣本點中心的性質(zhì) 答案 68 解析 由題意可得=(10+20+30+40+50)=30, 設要求的數(shù)據(jù)為t, 則有=(62+t+75+81+89)=, 因為回歸直線=0.67x+54.9過樣本點的中心(,), 所以=0.6730+54.9,解得t=68. 5.已知方程=0.85x-82.71是根據(jù)女大學生的身高預報她的體重的回歸方程,其中x的單位是cm,的單位是kg,那么針對某個體(160,53)的殘差是________. 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的運算 答案 -0.29 解析 把x=160代入=0.85x-82.71, 可得=0.85160-82.71=53.29, 所以殘差=y(tǒng)-=53-53.29=-0.29. 回歸分析的步驟 (1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量; (2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等); (3)由經(jīng)驗確定回歸方程的類型(如果呈線性關(guān)系,則選用線性回歸方程=x+); (4)按一定規(guī)則估計回歸方程中的參數(shù); (5)得出結(jié)果后分析殘差圖是否有異常(個別數(shù)據(jù)對應的殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等),若存在異常,則檢查數(shù)據(jù)是否有誤或模型是否合適等. 一、選擇題 1.某同學在研究性學習中,收集到某制藥廠今年前5個月甲膠囊生產(chǎn)產(chǎn)量(單位:萬盒)的數(shù)據(jù)如下表所示: x(月份) 1 2 3 4 5 y(萬盒) 5 5 6 6 8 若x,y線性相關(guān),線性回歸方程為=0.7x+,估計該制藥廠6月份生產(chǎn)甲膠囊產(chǎn)量為( ) A.8.0萬盒 B.8.1萬盒 C.8.9萬盒 D.8.6萬盒 考點 線性回歸方程 題點 樣本點中心的性質(zhì) 答案 B 解析 回歸直線一定過樣本點的中心.由已知數(shù)據(jù)可得=3,=6,代入線性回歸方程,可得=-0.7=3.9,即線性回歸方程為=0.7x+3.9.把x=6代入,可近似得=8.1,故選B. 2.如圖所示,由這兩個散點圖可以判斷( ) A.變量x與y正相關(guān),u與v正相關(guān) B.變量x與y正相關(guān),u與v負相關(guān) C.變量x與y負相關(guān),u與v正相關(guān) D.變量x與y負相關(guān),u與v負相關(guān) 考點 線性回歸分析 題點 回歸直線的概念 答案 C 解析 圖(1)中的數(shù)據(jù)隨著x的增大y減小,因此變量x與變量y負相關(guān); 圖(2)中的數(shù)據(jù)隨著u的增大v增大,因此u與v正相關(guān). 3.已知變量x與y負相關(guān),且由觀測數(shù)據(jù)求得樣本平均數(shù)=3,=3.5,則由該觀測數(shù)據(jù)求得的線性回歸方程可能是( ) A.=-2x+9.5 B.=2x-2.4 C.=-0.3x-4.4 D.=0.4x+2.3 考點 線性回歸方程 題點 求線性回歸方程 答案 A 解析 因為變量x與y負相關(guān),所以排除B,D,將樣本平均數(shù)=3,=3.5代入選項驗證可知,選項A符合題意. 4.對具有線性相關(guān)關(guān)系的變量x,y,有一組觀測數(shù)據(jù)(xi,yi)(i=1,2,…,8),其線性回歸方程是=x+,若x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6,則實數(shù)的值是( ) A. B. C. D. 考點 線性回歸方程 題點 樣本點中心的性質(zhì) 答案 D 解析 由x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6可知樣本點的中心為,將該點坐標代入回歸方程=x+,得=. 5.若對某地區(qū)人均工資x(萬元)與該地區(qū)人均消費y(萬元)進行調(diào)查統(tǒng)計得y與x具有線性相關(guān)關(guān)系,且線性回歸方程為=0.7x+2.1,若該地區(qū)人均消費水平為10.5,則估計該地區(qū)人均消費額占人均工資收入的百分比約為( ) A.75% B.87.5% C.70% D.10.5% 考點 線性回歸方程 題點 線性回歸方程的應用 答案 B 解析 y=10.5時,由=0.7x+2.1得x==12, 故得100%=87.5%. 6.甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關(guān)試驗用回歸分析的方法分別求得相關(guān)系數(shù)r如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 則這四位同學的試驗結(jié)果能體現(xiàn)出A,B兩變量有更強的線性相關(guān)性的是( ) A.甲 B.乙 C.丙 D.丁 考點 線性相關(guān)系數(shù) 題點 線性相關(guān)系數(shù)的概念及計算 答案 D 解析 由相關(guān)系數(shù)的意義可知,相關(guān)系數(shù)的絕對值越接近于1,相關(guān)性越強,結(jié)合題意可知丁的線性相關(guān)性更強,故選D. 7.某化工廠為預測某產(chǎn)品的回收率y,而要研究它和原料有效成分含量之間的相關(guān)關(guān)系,現(xiàn)取了8對觀測值,計算得i=52,i=228,=478,iyi=1849,則y與x的線性回歸方程是( ) A.=11.47+2.62x B.=-11.47+2.62x C.=2.62+11.47x D.=11.47-2.62x 考點 線性回歸方程 題點 求線性回歸方程 答案 A 解析 由題中數(shù)據(jù)得=6.5,=28.5, ∴===≈2.62, =-≈28.5-2.626.5=11.47, ∴y與x的線性回歸方程是=2.62x+11.47,故選A. 二、填空題 8.若一個樣本的總偏差平方和為80,殘差平方和為60,則相關(guān)指數(shù)R2為________. 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的運算 答案 0.25 解析 R2=1-=0.25. 9.已知樣本數(shù)據(jù)點(xi,yi)(i=1,2,3,…,n)在某一條直線上,則相關(guān)系數(shù)r的值為________. 考點 線性相關(guān)系數(shù) 題點 線性相關(guān)系數(shù)的概念及計算 答案 1 解析 由題意知r=1. 10.關(guān)于隨機誤差產(chǎn)生的原因分析正確的有________.(填序號) ①用線性回歸模型來近似真實模型所引起的誤差; ②忽略某些因素的影響所產(chǎn)生的誤差; ③對樣本數(shù)據(jù)觀測時產(chǎn)生的誤差; ④計算錯誤所產(chǎn)生的誤差. 考點 回歸分析 題點 回歸分析的概念和意義 答案 ①②③ 解析 理解線性回歸模型y=bx+a+e中隨機誤差e的含義是解決此問題的關(guān)鍵,隨機誤差可能由于觀測工具及技術(shù)產(chǎn)生,也可能因忽略某些因素而產(chǎn)生,也可以是回歸模型產(chǎn)生,但不是計算錯誤.故隨機誤差產(chǎn)生的原因分析正確的是①②③. 三、解答題 11.已知x,y之間的一組數(shù)據(jù)如下表: x 0 1 2 3 y 1 3 5 7 (1)分別計算:,,x1y1+x2y2+x3y3+x4y4,x+x+x+x; (2)已知變量x與y線性相關(guān),求出回歸方程. 考點 線性回歸方程 題點 求線性回歸方程 解 (1)==1.5,==4, x1y1+x2y2+x3y3+x4y4=01+13+25+37=34, x+x+x+x=02+12+22+32=14. (2)==2, =-=4-21.5=1, 故=2x+1. 12.某服裝批發(fā)市場1-5月份的服裝銷售量x與利潤y的統(tǒng)計數(shù)據(jù)如下表: 月份 1 2 3 4 5 銷售量x(萬件) 3 6 4 7 8 利潤y(萬元) 19 34 26 41 46 (1)從這五個月的利潤中任選2個,分別記為m,n,求事件“m,n均不小于30”的概率; (2)已知銷售量x與利潤y大致滿足線性相關(guān)關(guān)系,請根據(jù)前4個月的數(shù)據(jù),求出y關(guān)于x的線性回歸方程=x+; (3)若由線性回歸方程得到的利潤的估計數(shù)據(jù)與真實數(shù)據(jù)的誤差不超過2萬元,則認為得到的利潤的估計數(shù)據(jù)是理想的.請用表格中第5個月的數(shù)據(jù)檢驗由(2)中回歸方程所得的第5個月的利潤的估計數(shù)據(jù)是否理想? 參考公式:=,=-. 考點 線性回歸分析 題點 回歸直線的應用 解 (1)所有的基本事件為(19,34),(19,26),(19,41),(19,46),(34,26),(34,41),(34,46),(26,41),(26,46),(41,46),共10個. 記“m,n均不小于30”為事件A,則事件A包含的基本事件為(34,41),(34,46),(41,46),共3個. 所以P(A)=. (2)由前4個月的數(shù)據(jù)可得, =5,=30,iyi=652,=110. 所以===5.2, =30-5.25=4, 所以線性回歸方程為=5.2x+4, (3)由題意得,當x=8時, =45.6,|45.6-46|=0.4<2; 所以利用(2)中的回歸方程所得的第5個月的利潤估計數(shù)據(jù)是理想的. 13.在一段時間內(nèi),某種商品的價格x元和需求量y件之間的一組數(shù)據(jù)為: x 14 16 18 20 22 y 12 10 7 5 3 求出y對x的線性回歸方程,并說明擬合效果的程度. 考點 殘差分析與相關(guān)指數(shù) 題點 殘差及相關(guān)指數(shù)的應用 解 =(14+16+18+20+22)=18, =(12+10+7+5+3)=7.4. =142+162+182+202+222=1 660, iyi=1412+1610+187+205+223=620, 可得回歸系數(shù)===-1.15, 所以=7.4+1.1518=28.1, 所以線性回歸方程為=-1.15x+28.1. 列出殘差表: yi-i 0 0.3 -0.4 -0.1 0.2 yi- 4.6 2.6 -0.4 -2.4 -4.4 則(yi-i)2=0.3,(yi-)2=53.2. R2=1-≈0.994. 所以回歸模型的擬合效果很好. 四、探究與拓展 14.某公司的廣告費支出x(萬元)與銷售額y(萬元)之間有下表所示的對應數(shù)據(jù),由資料顯示y對x呈線性相關(guān)關(guān)系,根據(jù)下表提供的數(shù)據(jù)得到回歸方程=x+中的=6.5, x 2 4 5 6 8 y 30 40 60 50 70 預測銷售額為115萬元時,約需________萬元廣告費. 考點 線性回歸分析 題點 回歸直線的應用 答案 15 解析 因為=(2+4+5+6+8)=5, =(30+40+60+50+70)=50, 所以50=6.55+,則=17.5, 所以當y=115時,6.5x=115-17.5,得x=15, 即約需廣告費為15萬元. 15.某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此作了四次試驗,得到的數(shù)據(jù)如下: 零件的個數(shù)x(個) 2 3 4 5 加工的時間y(小時) 2.5 3 4 4.5 (1)在給定的坐標系中畫出表中數(shù)據(jù)的散點圖; (2)求出y關(guān)于x的線性回歸方程=x+,并在坐標系中畫出回歸直線; (3)試預測加工10個零件需要多少時間? 考點 線性回歸方程 題點 求線性回歸方程 解 (1)散點圖如圖. (2)由表中數(shù)據(jù)得iyi=52.5, =3.5,=3.5,=54, 所以===0.7, 所以=-=3.5-0.73.5=1.05. 所以=0.7x+1.05. 回歸直線如圖中所示. (3)將x=10代入線性回歸方程,得=0.710+1.05=8.05, 所以預測加工10個零件需要8.05小時.- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 2018-2019學年高中數(shù)學 第一章 統(tǒng)計案例 1.1回歸分析的基本思想及其初步應用同步學案 新人教A版選修1 -2 2018 2019 學年 高中數(shù)學 統(tǒng)計 案例 1.1 回歸 分析 基本 思想 及其
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權(quán),請勿作他用。
鏈接地址:http://m.appdesigncorp.com/p-3909016.html