2020版高考數(shù)學一輪復習 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關關系與統(tǒng)計案例教學案 理(含解析)北師大版
《2020版高考數(shù)學一輪復習 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關關系與統(tǒng)計案例教學案 理(含解析)北師大版》由會員分享,可在線閱讀,更多相關《2020版高考數(shù)學一輪復習 第9章 算法初步、統(tǒng)計與統(tǒng)計案例 第4節(jié) 變量間的相關關系與統(tǒng)計案例教學案 理(含解析)北師大版(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第四節(jié) 變量間的相關關系與統(tǒng)計案例 [考綱傳真] 1.會做兩個有關聯(lián)變量的數(shù)據(jù)的散點圖,并利用散點圖認識變量間的相關關系.2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸系數(shù)公式不要求記憶).3.了解回歸分析的基本思想、方法及其簡單應用.4.了解獨立性檢驗(只要求2×2列聯(lián)表)的思想、方法及其初步應用. 1.兩個變量的線性相關 (1)正相關 在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關. (2)負相關 在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關關系稱為負相關. (3)線性相關
2、關系、回歸直線 如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線. 2.回歸方程 (1)最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫做最小二乘法. (2)回歸方程:方程y=bx+a是兩個具有線性相關關系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中a,b是待定參數(shù). 3.回歸分析 (1)定義:對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法. (2)樣本點的中心 對于一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其中(,)稱為樣
3、本點的中心. (3)相關系數(shù) 當r>0時,表明兩個變量正相關; 當r<0時,表明兩個變量負相關. r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性. 4.獨立性檢驗 設A,B為兩個變量,每一個變量都可以取兩個值,變量A:A1,A2=;變量B:B1,B2=. 2×2列聯(lián)表 B A B1 B2 總計 A1 a b a+b A2 c d c+d 總計 a+c b+d a+b+c+d 構造一個統(tǒng)計量 χ2=. 利用統(tǒng)計量
4、χ2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗. 1.回歸直線必過樣本點的中心(,). 2.當兩個變量的相關系數(shù)|r|=1時,兩個變量呈函數(shù)關系. [基礎自測] 1.(思考辨析)判斷下列結論的正誤.(正確的打“√”,錯誤的打“×”) (1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關關系.( ) (2)通過回歸直線方程y=bx+a可以估計預報變量的取值和變化趨勢.( ) (3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗.( ) (4)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的χ2的觀測值越大.( ) [答案]
5、(1)√ (2)√ (3)× (4)√ 2.為了調查中學生近視情況,測得某校男生150名中有80名近視,在140名女生中有70名近視.要檢驗這些學生眼睛近視是否與性別有關時,用下列哪種方法最有說服力( ) A.回歸分析 B.均值與方差 C.獨立性檢驗 D.概率 C [“近視”與“性別”是兩類變量,其是否相關,應用獨立性檢驗判斷.] 3.已知回歸直線的斜率的估計值是1.23,樣本點的中心為(4,5),若自變量的值為10,則因變量的值約為( ) A.16.3 B.17.3 C.12.38 D.2.03 C [設回歸直線方程為y=bx+a,根據(jù)已
6、知得5=1.23×4+a,所以a=0.08,所以當x=10時,y=1.23×10+0.08=12.38.] 4.下面是一個2×2列聯(lián)表 y1 y2 總計 x1 a 21 73 x2 2 25 27 總計 b 46 則表中a,b處的值分別為________. 52,54 [因為a+21=73,所以a=52.又因為a+2=b,所以b=54.] 5.為了判斷高中三年級學生是否選修文科與性別的關系,現(xiàn)隨機抽取50名學生,得到如下2×2列聯(lián)表: 理科 文科 男 13 10 女 7 20 已知P(χ2≥3.841)≈0.05,P(χ2≥5.
7、024)≈0.025. 根據(jù)表中數(shù)據(jù),得到χ2的觀測值k=≈4.844.則認為選修文科與性別有關系出錯的可能性為________. 5% [χ2的觀測值k≈4.844,這表明小概率事件發(fā)生.根據(jù)假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷出錯的可能性約為5%.] 相關關系的判斷 1.已知變量x和y近似滿足關系式y(tǒng)=-0.1x+1,變量y與z正相關.下列結論中正確的是( ) A.x與y正相關,x與z負相關 B.x與y正相關,x與z正相關 C.x與y負相關,x與z負相關 D.x與y負相關,x與z正相關 C [由y=-0.1x+1,知x與
8、y負相關,即y隨x的增大而減小,又y與z正相關,所以z隨y的增大而增大,減小而減小,所以z隨x的增大而減小,x與z負相關.] 2.對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的比較,正確的是( ) A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3 C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3 A [由相關系數(shù)的定義以及散點圖可知r2<r4<0<r3<r1.] [規(guī)律方法] 判定兩個變量正、負相關性的方法 (1)畫散點圖:點的分布從左下角到右上角,兩個變量正相關;點的分布從左上角到右下角,兩個變量負相關. (2)相關系數(shù):r>0
9、時,正相關;r<0時,負相關. (3)線性回歸直線方程中:b>0時,正相關;b<0時,負相關. 回歸分析 【例1】 (2018·廣州一模)某地1~10歲男童年齡xi(歲)與身高的中位數(shù)yi(cm)(i=1,2,…,10)如下表: x/歲 1 2 3 4 5 6 7 8 9 10 y/cm 76.5 88.5 96.8 104.1 111.3 117.7 124.0 130.0 135.4 140.2 對上表的數(shù)據(jù)作初步處理,得到下面的散點圖及一些統(tǒng)計量的值. (xi-)2 (yi-)2 (xi-)(yi-) 5.
10、5 112.45 82.50 3 947.71 566.85 (1)求y關于x的線性回歸方程(回歸方程系數(shù)精確到0.01); (2)某同學認為,y=px2+qx+r更適宜作為y關于x的回歸方程類型,他求得的回歸方程是y=-0.30x2+10.17x+68.07.經(jīng)調查,該地11歲男童身高的中位數(shù)為145.3 cm.與(1)中的線性回歸方程比較,哪個回歸方程的擬合效果更好? 附:回歸方程y=a+bx中的斜率和截距的最小二乘估計公式分別為b=,a=-b. [解] (1)b==≈6.87, a=-b≈112.45-6.87×5.5≈74.67, 所以y關于x的線性回歸方程為y=6
11、.87x+74.67. (2)若回歸方程為y=6.87x+74.67, 當x=11時,y=150.24. 若回歸方程為y=-0.30x2+10.17x+68.07, 當x=11時,y=143.64. 因為|143.64-145.3|=1.66<|150.24-145.3|=4.94, 所以回歸方程y=-0.30x2+10.17x+68.07對該地11歲男童身高中位數(shù)的擬合效果更好. [規(guī)律方法] 1.求回歸直線方程的步驟 2.(1)若已知回歸直線方程(方程中無參數(shù))進行預測時,把變量x代入回歸直線方程即可對變量y進行估計. (2)若回歸直線方程中有參數(shù),則根據(jù)回歸直線一定
12、經(jīng)過點(,)求出參數(shù)值,得到回歸直線方程,進而完成預測. (1)(2017·山東高考)為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與x之間有線性相關關系.設其回歸直線方程為y=bx+a.已知xi=225,yi=1 600,b=4.該班某學生的腳長為24,據(jù)此估計其身高為( ) A.160 B.163 C.166 D.170 (2)(2016·全國卷Ⅲ)如圖是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖. 注:年份代碼1-7分別對應年份2008-2014.
13、 ①由折線圖看出,可用線性回歸模型擬合y與t的關系,請用相關系數(shù)加以說明; ②建立y關于t的回歸方程(系數(shù)精確到0.01),預測2016年我國生活垃圾無害化處理量. 附注: 參考數(shù)據(jù):yi=9.32,tiyi=40.17,=0.55,≈2.646. 參考公式:相關系數(shù)r=,回歸方程y=a+bt中斜率和截距的最小二乘估計公式分別為b=,a=-b. (1)C [∵xi=225,∴=xi=22.5. ∵yi=1 600,∴=y(tǒng)i=160. 又b=4,∴a=-b=160-4×22.5=70. ∴回歸直線方程為y=4x+70. 將x=24代入上式得y=4×24+70=166. 故
14、選C.] (2)[解]?、儆烧劬€圖中的數(shù)據(jù)和附注中的參考數(shù)據(jù)得 =4, (ti-)2=28,=0.55, (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89, 所以r≈≈0.99. 因為y與t的相關系數(shù)近似為0.99,說明y與t的線性相關程度相當大,從而可以用線性回歸模型擬合y與t的關系. ②由=≈1.331及①得 b==≈0.103. a=-b≈1.331-0.103×4≈0.92. 所以y關于t的回歸方程為y=0.92+0.10t. 將2016年對應的t=9代入回歸方程得y=0.92+0.10×9=1.82. 所以預測2016年我國生活
15、垃圾無害化處理量約為1.82億噸. 獨立性檢驗 【例2】 (2018·全國卷Ⅲ)某工廠為提高生產(chǎn)效率,開展技術創(chuàng)新活動,提出了完成某項生產(chǎn)任務的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組,每組20人.第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任務的工作時間(單位:min)繪制了如圖所示的莖葉圖: (1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高?并說明理由; (2)求40名工人完成生產(chǎn)任務所需時間的中位數(shù)m,并將完成生產(chǎn)任務所需時間超過m和不超過m的工人數(shù)填入下面的列聯(lián)表: 超過m 不超過m 第一種生產(chǎn)方式
16、 第二種生產(chǎn)方式 (3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異? 附:χ2=, P(χ2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 [解] (1)第二種生產(chǎn)方式的效率更高. 理由如下: (i)由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至少80分鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務所需時間至多79分鐘.因此第二種生產(chǎn)方式的效率更高. (ⅱ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為85.5分鐘,用第二種
17、生產(chǎn)方式的工人完成生產(chǎn)任務所需時間的中位數(shù)為73.5分鐘.因此第二種生產(chǎn)方式的效率更高. (ⅲ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間高于80分鐘;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務平均所需時間低于80分鐘.因此第二種生產(chǎn)方式的效率更高. (ⅳ)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖8上的最多,關于莖8大致呈對稱分布;用第二種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布在莖7上的最多,關于莖7大致呈對稱分布.又用兩種生產(chǎn)方式的工人完成生產(chǎn)任務所需時間分布的區(qū)間相同,故可以認為用第二種生產(chǎn)方式完成生產(chǎn)任務所需的時間比用第一種生產(chǎn)方式完成生產(chǎn)任務所需的
18、時間更少.因此第二種生產(chǎn)方式的效率更高. (以上給出了4種理由,答出其中任意一種或其他合理理由均可) (2)由莖葉圖知m==80. 列聯(lián)表如下: 超過m 不超過m 第一種生產(chǎn)方式 15 5 第二種生產(chǎn)方式 5 15 (3)由于χ2==10>6.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異. [規(guī)律方法] 1.在2×2列聯(lián)表中,如果兩個變量沒有關系,則應滿足ad-bc≈0.|ad-bc|越小,說明兩個變量之間關系越弱;|ad-bc|越大,說明兩個變量之間關系越強. 2.解決獨立性檢驗的應用問題,一定要按照獨立性檢驗的步驟得出結論.獨立性檢驗的一般步驟:
19、 (1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表; (2)根據(jù)公式χ2=計算χ2的觀測值k; (3)比較觀測值k與臨界值的大小關系,作統(tǒng)計推斷. 某研究型學習小組調查研究學生使用智能手機對學習的影響.部分統(tǒng)計數(shù)據(jù)如下表: 使用智能手機 不使用智能手機 合計 學習成績優(yōu)秀 4 8 12 學習成績不優(yōu)秀 16 2 18 估計 20 10 30 附表: P(χ2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.82
20、8 經(jīng)計算χ2的值為10,則下列選項正確的是( ) A.有99.5%的把握認為使用智能手機對學習有影響 B.有99.5%的把握認為使用智能手機對學習無影響 C.有99.9%的把握認為使用智能手機對學習有影響 D.有99.9%的把握認為使用智能手機對學習無影響 A [依題意,注意到7.879<10<10.828,因此有99.5%的把握認為使用智能手機對學習有影響,故選A.] 1.(2015·全國卷Ⅰ)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,
21、…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值. (xi-)2 (wi-)2 (xi-)(yi-) (wi-)·(yi-) 46.6 563 6.8 289.8 1.6 1 469 108.8 表中wi=,w]=wi. (1)根據(jù)散點圖判斷,y=a+bx與y=c+d哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由) (2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立y關于x的回歸方程; (3)已知這種產(chǎn)品的年利潤z與x,y的關系為z=0.2y-x.根據(jù)(2)的結果回答下列問題: ①年宣傳費x=49時,
22、年銷售量及年利潤的預報值是多少? ②年宣傳費x為何值時,年利潤的預報值最大? 附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線v=α+βu的斜率和截距的最小二乘估計分別為β=,α=-β. [解] (1)由散點圖可以判斷,y=c+d適宜作為年銷售量y關于年宣傳費x的回歸方程類型. (2)令w=,先建立y關于w的線性回歸方程. 由于d===68, c=-d =563-68×6.8=100.6, 所以y關于w的線性回歸方程為y=100.6+68w, 因此y關于x的回歸方程為y=100.6+68. (3)①由(2)知,當x=49時, 年銷售量y的預報值
23、y=100.6+68=576.6, 年利潤z的預報值z=576.6×0.2-49=66.32. ②根據(jù)(2)的結果知,年利潤z的預報值 z=0.2(100.6+68)-x=-x+13.6+20.12. 所以當==6.8,即x=46.24時,z取得最大值. 故年宣傳費為46.24千元時,年利潤的預報值最大. 2.(2017·全國卷Ⅱ)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下: (1)設兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg,新養(yǎng)殖法的箱產(chǎn)量不
24、低于50 kg”,估計A的概率; (2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關; 箱產(chǎn)量<50 kg 箱產(chǎn)量≥50 kg 舊養(yǎng)殖法 新養(yǎng)殖法 (3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01). 附: P(χ2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 χ2=. [解] (1)記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50 kg”. 由題意知P(A)=P(BC)=P(B)P(C). 舊養(yǎng)
25、殖法的箱產(chǎn)量低于50 kg的頻率為 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P(B)的估計值為0.62. 新養(yǎng)殖法的箱產(chǎn)量不低于50 kg的頻率為 (0.068+0.046+0.010+0.008)×5=0.66, 故P(C)的估計值為0.66. 因此,事件A的概率估計值為0.62×0.66=0.409 2. (2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表 箱產(chǎn)量<50 kg 箱產(chǎn)量≥50 kg 舊養(yǎng)殖法 62 38 新養(yǎng)殖法 34 66 χ2=≈15.705. 由于15.705>6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關. (3)因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50 kg的直方圖面積為 (0.004+0.020+0.044)×5=0.34<0.5, 箱產(chǎn)量低于55 kg的直方圖面積為 (0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新養(yǎng)殖法產(chǎn)量的中位數(shù)的估計值為 50+≈52.35(kg). - 12 -
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。