2019-2020年高考數(shù)學復習 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例.doc
《2019-2020年高考數(shù)學復習 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例.doc》由會員分享,可在線閱讀,更多相關(guān)《2019-2020年高考數(shù)學復習 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例.doc(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
2019-2020年高考數(shù)學復習 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例 以選擇題或填空題的形式考查回歸分析及獨立性檢驗中的基本思想方法及其簡單應(yīng)用. 【復習指導】 高考在該部分的主要命題點就是回歸分析和獨立性檢驗的基礎(chǔ)知識和簡單應(yīng)用.復習時要掌握好回歸分析和獨立性檢驗的基本思想、方法和基本公式. 基礎(chǔ)梳理 1.相關(guān)關(guān)系的分類 從散點圖上看,點散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān);點散布在從左上角到右下角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為負相關(guān). 2.線性相關(guān) 從散點圖上看,如果這些點從整體上看大致分布在一條直線附近,則稱這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫回歸直線. 3.回歸方程 (1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離平方和最小的方法叫最小二乘法. (2)回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù): (x1,y1),(x2,y2),…,(xn,yn),其回歸方程為=x+,則 其中,b是回歸方程的斜率,a是在y軸上的截距. 4.樣本相關(guān)系數(shù) r=,用它來衡量兩個變量間的線性相關(guān)關(guān)系. (1)當r>0時,表明兩個變量正相關(guān); (2)當r<0時,表明兩個變量負相關(guān); (3)r的絕對值越接近1,表明兩個變量的線性相關(guān)性越強;r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關(guān)關(guān)系.通常當|r|>0.75時,認為兩個變量有很強的線性相關(guān)關(guān)系. 5.線性回歸模型 (1)y=bx+a+e中,a、b稱為模型的未知參數(shù);e稱為隨機誤差. (2)相關(guān)指數(shù) 用相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是:R2= ,R2的值越大,說明殘差 平方和越小,也就是說模型的擬合效果越好.在線性回歸模型中,R2表示解釋變量對預(yù)報變量變化的貢獻率,R2越接近于1,表示回歸效果越好. 6.獨立性檢驗 (1)用變量的不同“值”表示個體所屬的不同類別,這種變量稱為分類變量.例如:是否吸煙,宗教信仰,國籍等. (2)列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表. (3)一般地,假設(shè)有兩個分類變量X和Y,它們的值域分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為22列聯(lián)表)為: 22列聯(lián)表 y1 y2 總計 x1 a b a+b x2 c d c+d 總計 a+c b+d a+b+c+d K2=(其中n=a+b+c+d為樣本容量),可利用獨立性檢驗判斷表來判斷“x與y的關(guān)系”. 這種利用隨機變量K2來確定在多大程度上可以認為“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨立性檢驗. 兩個規(guī)律 (1)函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系.事實上,函數(shù)關(guān)系是兩個非隨機變量的關(guān)系,而相關(guān)關(guān)系是非隨機變量與隨機變量的關(guān)系. (2)當K2≥3.841時,則有95%的把握說事A與B有關(guān); 當K2≥6.635時,則有99%的把握說事件A與B有關(guān); 當K2≤2.706時,則認為事件A與B無關(guān). 三個注意 (1)回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義,否則,求出的回歸直線方程毫無意義. (2)線性回歸方程中的截距和斜率都是通過樣本數(shù)據(jù)估計而來的,存在誤差,這種誤差會導致預(yù)報結(jié)果的偏差;而且回歸方程只適用于我們所研究的樣本總體. (3)獨立性檢驗的隨機變量K2=3.841是判斷是否有關(guān)系的臨界值,K2≤3.841應(yīng)判斷為沒有充分證據(jù)顯示事件A與B有關(guān)系,而不能作為小于95%的量化值來判斷. 雙基自測 1.(人教A版教材習題改編)下面哪些變量是相關(guān)關(guān)系( ). A.出租車車費與行駛的里程 B.房屋面積與房屋價格 C.身高與體重 D.鐵塊的大小與質(zhì)量 解析 A,B,D都是函數(shù)關(guān)系,其中A一般是分段函數(shù),只有C是相關(guān)關(guān)系. 答案 C 2.對變量x,y有觀測數(shù)據(jù)(xi,yi)(i=1,2,…,10),得散點圖(1);對變量u,v有觀測數(shù)據(jù)(ui、vi)(i=1,2,…,10),得散點圖(2).由這兩個散點圖可以判斷 ( ). A.變量x與y正相關(guān),u與v正相關(guān) B.變量x與y正相關(guān),u與v負相關(guān) C.變量x與y負相關(guān),u與v正相關(guān) D.變量x與y負相關(guān),u與v負相關(guān) 解析 由題圖(1)可知,各點整體呈遞減趨勢,x與y負相關(guān);由題圖(2)可知,各點整體呈遞增趨勢,u與v正相關(guān). 答案 C 3.(xx南昌模擬)某商品銷售量y(件)與銷售價格x(元/件)負相關(guān),則其回歸方程可能是( ). A.=-10x+200 B.=10x+200 C.=-10x-200 D.=10x-200 解析 因為銷量與價格負相關(guān),由函數(shù)關(guān)系考慮為減函數(shù),又因為x,y不能為負數(shù),再排除C,故選A. 答案 A 4.(xx棗莊模擬)下面是22列聯(lián)表: y1 y2 合計 x1 a 21 73 x2 22 25 47 合計 b 46 120 則表中a,b的值分別為( ). A.94,72 B.52,50 C.52,74 D.74,52 解析 ∵a+21=73,∴a=52,又a+22=b,∴b=74. 答案 C 5.在一項打鼾與患心臟病的調(diào)查中,共調(diào)查了1 671人,經(jīng)過計算K2的觀測值k=27.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認為打鼾與患心臟病是________的(有關(guān),無關(guān)). 解析 由觀測值k=27.63與臨界值比較,我們有99%的把握說打鼾與患心臟病有關(guān). 答案 有關(guān) 考向一 相關(guān)關(guān)系的判斷 【例1】?山東魯潔棉業(yè)公司的科研人員在7塊并排、形狀大小相同的試驗田上對某棉花新品種進行施化肥量x對產(chǎn)量y影響的試驗,得到如下表所示的一組數(shù)據(jù)(單位:kg): 施化肥量x 15 20 25 30 35 40 45 棉花產(chǎn)量y 330 345 365 405 445 450 455 (1)畫出散點圖; (2)判斷是否具有相關(guān)關(guān)系. [審題視點] (1)用x軸表示化肥施用量,y軸表示棉花產(chǎn)量,逐一畫點. (2)根據(jù)散點圖,分析兩個變量是否存在相關(guān)關(guān)系. 解 (1)散點圖如圖所示 (2)由散點圖知,各組數(shù)據(jù)對應(yīng)點大致都在一條直線附近,所以施化肥量x與產(chǎn)量y具有線性相關(guān)關(guān)系. 利用散點圖判斷兩個變量是否有相關(guān)關(guān)系是比較簡便的方法.在散點圖中如果所有的樣本點都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系.即變量之間具有函數(shù)關(guān)系.如果所有的樣本點落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系;如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)關(guān)系. 【訓練1】 根據(jù)兩個變量x,y之間的觀測數(shù)據(jù)畫成散點圖如圖所示,這兩個變量是否具有線性相關(guān)關(guān)系________(填“是”與“否”). 解析 從散點圖看,散點圖的分布成團狀,無任何規(guī)律,所以兩個變量不具有線性相關(guān)關(guān)系. 答案 否 考向二 獨立性檢驗 【例2】?(xx全國新課標)為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了500位老年人,結(jié)果如下: 性別 是否需要志愿者 男 女 需要 40 30 不需要 160 270 (1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例; (2)能否有99%的把握認為該地區(qū)老年人是否需要志愿者提供幫助與性別有關(guān)? (3)根據(jù)(2)的結(jié)論,能否提出更好的調(diào)查方法來估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例?說明理由. 附: P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 K2= [審題視點] 第(2)問由a=40,b=30,c=160,d=270,代入公式可求K2,由K2的值與6.635比較斷定.第(3)問從抽樣方法說明. 解 (1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例的估計值為=14%. (2)K2=≈9.967. 由于9.967>6.635,所以有99%的把握認為該地區(qū)老年人是否需要幫助與性別有關(guān). (3)由(2)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層,采用分層抽樣方法,這要比采用簡單隨機抽樣方法更好. 獨立性檢驗的步驟: (1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表; (2)根據(jù)公式K2=計算K2的觀測值; (3)比較K2與臨界值的大小關(guān)系作統(tǒng)計推斷. 【訓練2】 某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在[29.94,30.06)的零件為優(yōu)質(zhì)品.從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺寸,得結(jié)果如下表: 甲廠: 分組 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 頻數(shù) 12 63 86 182 92 61 4 乙廠: 分組 [29.86, 29.90) [29.90, 29.94) [29.94, 29.98) [29.98, 30.02) [30.02, 30.06) [30.06, 30.10) [30.10, 30.14) 頻數(shù) 29 71 85 159 76 62 18 (1)試分別估計兩個分廠生產(chǎn)零件的優(yōu)質(zhì)品率; (2)由以上統(tǒng)計數(shù)據(jù)填下面22列聯(lián)表,并問是否有99%的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”. 甲 廠 乙 廠 合 計 優(yōu)質(zhì)品 非優(yōu)質(zhì)品 合 計 附 K2=, P(K2≥k) 0.05 0.01 k 3.841 6.635 解 (1)甲廠抽查的產(chǎn)品中有360件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為100%=72%; 乙廠抽查的產(chǎn)品中有320件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為100%=64%. (2) 甲 廠 乙 廠 合 計 優(yōu)質(zhì)品 360 320 680 非優(yōu)質(zhì)品 140 180 320 合 計 500 500 1 000 K2=≈7.35>6.635, 所以有99%的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”. 考向三 線性回歸方程 【例3】?(xx菏澤模擬)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標準煤)的幾組對照數(shù)據(jù). x 3 4 5 6 y 2.5 3 4 4.5 (1)請畫出上表數(shù)據(jù)的散點圖; (2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程=x+; (3)已知該廠技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標準煤.試根據(jù)(2)求出的線性回歸方程.預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標準煤? (參考數(shù)值:32.5+43+54+64.5=66.5) [審題視點] (2)問利用公式求、,即可求出線性回歸方程. (3)問將x=100代入回歸直線方程即可. 解 (1)由題設(shè)所給數(shù)據(jù),可得散點圖如圖所示. (2)由對照數(shù)據(jù),計算得:=86, ==4.5(噸),==3.5(噸). 已知iyi=66.5, 所以,由最小二乘法確定的回歸方程的系數(shù)為: ===0.7, =-=3.5-0.74.5=0.35. 因此,所求的線性回歸方程為=0.7x+0.35. (3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的生產(chǎn)能耗為: 90-(0.7100+0.35)=19.65(噸標準煤). 在解決具體問題時,要先進行相關(guān)性檢驗,通過檢驗確認兩個變量是否具有線性相關(guān)關(guān)系,若它們之間有線性相關(guān)關(guān)系,再求回歸直線方程. 【訓練3】 (2011江西)為了解兒子身高與其父親身高的關(guān)系,隨機抽取5對父子的身高數(shù)據(jù)如下: 父親身高x/cm 174 176 176 176 178 兒子身高y/cm 175 175 176 177 177 則y對x的線性回歸方程為( ). A.y=x-1 B.y=x+1 C.y=88+x D.y=176 解析 由題意得==176(cm), ==176(cm),由于(,)一定滿足線性回歸方程,經(jīng)驗證知選C. 答案 C 閱卷報告15——數(shù)據(jù)處理不當導致計算錯誤而失分 【問題診斷】 由于大多數(shù)省市高考要求不準使用計算器,而線性回歸問題和獨立性檢驗問題仍是近幾年新課標高考的常考點,并且大多是考查考生的計算能力,就計算方面常有不少考生因計算出錯而失分. 【防范措施】 平時訓練時首先養(yǎng)成勤于動手的習慣,親自動手計算,再者考場上要保持心態(tài)放松,做題時細心認真,最終可減少錯誤的發(fā)生. 【示例】?(2011安徽)某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計數(shù)據(jù): 年份 xx xx xx xx xx 需求量(萬噸) 236 246 257 276 286 (1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程=bx+a; (2)利用(1)中所求出的直線方程預(yù)測該地xx年的糧食需求量. 實錄 (1)=2 006,==260.2. b= + =6.2, 錯因 求b時計算出錯,b值不準確.a(chǎn)=-b=260.2-6.22 006=-12 177. ∴=6.2x-12 177. (2)=6.22 012-12 177=297.4. 正解 (1)由所給數(shù)據(jù)看出,年需求量與年份之間是近似直線上升,下面來配回歸直線方程,為此對數(shù)據(jù)預(yù)處理如下: 年份-xx -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 對預(yù)處理后的數(shù)據(jù),容易算得, =0,=3.2, b= ==6.5,a=-b=3.2. 由上述計算結(jié)果,知所求回歸直線方程為-257=b(x-2 006)+a=6.5(x-2 006)+3.2, 即=6.5(x-2 006)+260.2.① (2)利用直線方程①,可預(yù)測xx年的糧食需求量為 6.5(2 012-2 006)+260.2=6.56+260.2=299.2(萬噸).- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 2019-2020年高考數(shù)學復習 第3講 變量間的相關(guān)關(guān)系與統(tǒng)計案例 2019 2020 年高 數(shù)學 復習 變量 相關(guān) 關(guān)系 統(tǒng)計 案例
鏈接地址:http://m.appdesigncorp.com/p-3245033.html