2019-2020年高中數學3.1回歸分析(一)教案北師大選修2-3.doc
-
資源ID:2570903
資源大小:180KB
全文頁數:7頁
- 資源格式: DOC
下載積分:9.9積分
快捷下載
會員登錄下載
微信登錄下載
微信掃一掃登錄
友情提示
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標題沒有明確說明有答案則都視為沒有答案,請知曉。
|
2019-2020年高中數學3.1回歸分析(一)教案北師大選修2-3.doc
2019-2020年高中數學3.1回歸分析(一)教案北師大選修2-3教學目標(1)通過實例引入線性回歸模型,感受產生隨機誤差的原因;(2)通過對回歸模型的合理性等問題的研究,滲透線性回歸分析的思想和方法;(3)能求出簡單實際問題的線性回歸方程教學重點,難點線性回歸模型的建立和線性回歸系數的最佳估計值的探求方法教學過程一問題情境1 情境:對一作直線運動的質點的運動過程觀測了次,得到如下表所示的數據,試估計當x=時的位置y的值時刻/s位置觀測值/cm根據數學(必修)中的有關內容,解決這個問題的方法是:先作散點圖,如下圖所示:從散點圖中可以看出,樣本點呈直線趨勢,時間與位置觀測值y之間有著較好的線性關系因此可以用線性回歸方程來刻畫它們之間的關系根據線性回歸的系數公式,可以得到線性回歸方為,所以當時,由線性回歸方程可以估計其位置值為2問題:在時刻時,質點的運動位置一定是嗎?二學生活動思考,討論:這些點并不都在同一條直線上,上述直線并不能精確地反映與之間的關系,的值不能由完全確定,它們之間是統(tǒng)計相關關系,的實際值與估計值之間存在著誤差三建構數學1線性回歸模型的定義:我們將用于估計值的線性函數作為確定性函數;的實際值與估計值之間的誤差記為,稱之為隨機誤差;將稱為線性回歸模型說明:(1)產生隨機誤差的主要原因有:所用的確定性函數不恰當引起的誤差;忽略了某些因素的影響;存在觀測誤差 (2)對于線性回歸模型,我們應該考慮下面兩個問題: 模型是否合理(這個問題在下一節(jié)課解決); 在模型合理的情況下,如何估計,?2探求線性回歸系數的最佳估計值:對于問題,設有對觀測數據,根據線性回歸模型,對于每一個,對應的隨機誤差項,我們希望總誤差越小越好,即要使越小越好所以,只要求出使取得最小值時的,值作為,的估計值,記為,注:這里的就是擬合直線上的點到點的距離用什么方法求,?回憶數學3(必修)“24線性回歸方程”P71“熱茶問題”中求,的方法:最小二乘法利用最小二乘法可以得到,的計算公式為,其中,由此得到的直線就稱為這對數據的回歸直線,此直線方程即為線性回歸方程其中,分別為,的估計值,稱為回歸截距,稱為回歸系數,稱為回歸值在前面質點運動的線性回歸方程中,3 線性回歸方程中,的意義是:以為基數,每增加1個單位,相應地平均增加個單位;4 化歸思想(轉化思想)在實際問題中,有時兩個變量之間的關系并不是線性關系,這就需要我們根據專業(yè)知識或散點圖,對某些特殊的非線性關系,選擇適當的變量代換,把非線性方程轉化為線性回歸方程,從而確定未知參數下面列舉出一些常見的曲線方程,并給出相應的化為線性回歸方程的換元公式 (1),令,則有 (2),令,則有 (3),令,則有 (4),令,則有 (5),令,則有四數學運用1例題:例1下表給出了我國從年至年人口數據資料,試根據表中數據估計我國年的人口數年份人口數/百萬解:為了簡化數據,先將年份減去,并將所得值用表示,對應人口數用表示,得到下面的數據表:作出個點構成的散點圖,由圖可知,這些點在一條直線附近,可以用線性回歸模型來表示它們之間的關系根據公式(1)可得這里的分別為的估計值,因此線性回歸方程為由于年對應的,代入線性回歸方程可得(百萬),即年的人口總數估計為13.23億.例2 某地區(qū)對本地的企業(yè)進行了一次抽樣調查,下表是這次抽查中所得到的各企業(yè)的人均資本(萬元)與人均產出(萬元)的數據:人均資本/萬元人均產出/萬元 (1)設與之間具有近似關系(為常數),試根據表中數據估計和的值; (2)估計企業(yè)人均資本為萬元時的人均產出(精確到)分析:根據,所具有的關系可知,此問題不是線性回歸問題,不能直接用線性回歸方程處理但由對數運算的性質可知,只要對的兩邊取對數,就能將其轉化為線性關系解(1)在的兩邊取常用對數,可得,設,則相關數據計算如圖所示1人均資本/萬元345.56.578910.511.5142人均產出/萬元4.124.678.6811.0113.0414.4317.525.4626.6645.230.477120.602060.740360.812910.84510.903090.954241.021191.06071.1461340.61490.669320.938521.041791.115281.159271.243041.405861.425861.65514仿照問題情境可得,的估計值,分別為由可得,即,的估計值分別為和 (2)由(1)知樣本數據及回歸曲線的圖形如圖(見書本 頁)當時,(萬元),故當企業(yè)人均資本為萬元時,人均產值約為萬元2練習:練習第題五回顧小結:1 線性回歸模型與確定性函數相比,它表示與之間是統(tǒng)計相關關系(非確定性關系)其中的隨機誤差提供了選擇模型的準則以及在模型合理的情況下探求最佳估計值,的工具;2 線性回歸方程中,的意義是:以為基數,每增加1個單位,相應地平均增加個單位;3求線性回歸方程的基本步驟六課外作業(yè):第題回歸分析(2)教學目標(1)通過實例了解相關系數的概念和性質,感受相關性檢驗的作用;(2)能對相關系數進行顯著性檢驗,并解決簡單的回歸分析問題;(3)進一步了解回歸的基本思想、方法及初步應用教學重點,難點相關系數的性質及其顯著性檢驗的基本思想、操作步驟教學過程一問題情境1情境:下面是一組數據的散點圖,若求出相應的線性回歸方程,求出的線性回歸方程可以用作預測和估計嗎?2問題:思考、討論:求得的線性回歸方程是否有實際意義二學生活動對任意給定的樣本數據,由計算公式都可以求出相應的線性回歸方程,但求得的線性回歸方程未必有實際意義左圖中的散點明顯不在一條直線附近,不能進行線性擬合,求得的線性回歸方程是沒有實際意義的;右圖中的散點基本上在一條直線附近,我們可以粗略地估計兩個變量間有線性相關關系,但它們線性相關的程度如何,如何較為精確地刻畫線性相關關系呢?這就是上節(jié)課提到的問題,即模型的合理性問題為了回答這個問題,我們需要對變量與的線性相關性進行檢驗(簡稱相關性檢驗)三建構數學1相關系數的計算公式:對于,隨機取到的對數據,樣本相關系數的計算公式為2相關系數的性質: (1); (2)越接近與1,的線性相關程度越強; (3)越接近與0,的線性相關程度越弱可見,一條回歸直線有多大的預測功能,和變量間的相關系數密切相關3對相關系數進行顯著性檢驗的步驟: 相關系數的絕對值與1接近到什么程度才表明利用線性回歸模型比較合理呢?這需要對相關系數進行顯著性檢驗對此,在統(tǒng)計上有明確的檢驗方法,基本步驟是:(1)提出統(tǒng)計假設:變量,不具有線性相關關系;(2)如果以的把握作出推斷,那么可以根據與(是樣本容量)在附錄(教材P111)中查出一個的臨界值(其中稱為檢驗水平);(3)計算樣本相關系數;(4)作出統(tǒng)計推斷:若,則否定,表明有的把握認為變量與之間具有線性相關關系;若,則沒有理由拒絕,即就目前數據而言,沒有充分理由認為變量與之間具有線性相關關系說明:1對相關系數進行顯著性檢驗,一般取檢驗水平,即可靠程度為2這里的指的是線性相關系數,的絕對值很小,只是說明線性相關程度低,不一定不相關,可能是非線性相關的某種關系3這里的是對抽樣數據而言的有時即使,兩者也不一定是線性相關的故在統(tǒng)計分析時,不能就數據論數據,要結合實際情況進行合理解釋4對于上節(jié)課的例1,可按下面的過程進行檢驗:(1)作統(tǒng)計假設:與不具有線性相關關系;(2)由檢驗水平與在附錄中查得;(3)根據公式得相關系數;(4)因為,即,所以有的把握認為與之間具有線性相關關系,線性回歸方程為是有意義的四數學運用1例題:例1下表是隨機抽取的對母女的身高數據,試根據這些數據探討與之間的關系母親身高女兒身高解:所給數據的散點圖如圖所示:由圖可以看出,這些點在一條直線附近, 因為, 所以,由檢驗水平及,在附錄中查得,因為,所以可以認為與之間具有較強的線性相關關系線性回歸模型中的估計值分別為 ,故對的線性回歸方程為例2要分析學生高中入學的數學成績對高一年級數學學習的影響,在高一年級學生中隨機抽取名學生,分析他們入學的數學成績和高一年級期末數學考試成績如下表:學生編號入學成績高一期末成績(1)計算入學成績與高一期末成績的相關系數;(2)如果與之間具有線性相關關系,求線性回歸方程;(3)若某學生入學數學成績?yōu)榉郑嚬烙嬎咭黄谀祵W考試成績解:(1)因為,因此求得相關系數為結果說明這兩組數據的相關程度是比較高的;小結解決這類問題的解題步驟: (1)作出散點圖,直觀判斷散點是否在一條直線附近; (2)求相關系數; (3)由檢驗水平和的值在附錄中查出臨界值,判斷與是否具有較強的線性相關關系; (4)計算,寫出線性回歸方程2練習:練習第題五回顧小結:1相關系數的計算公式與回歸系數計算公式的比較;2相關系數的性質;3探討相關關系的基本步驟六課外作業(yè):習題3.2第題