《(全國通用)高考數(shù)學大一輪復習 第十章 統(tǒng)計與統(tǒng)計案例、概率 第3節(jié) 變量間的相關關系與統(tǒng)計案例課件 文 新人教A》由會員分享,可在線閱讀,更多相關《(全國通用)高考數(shù)學大一輪復習 第十章 統(tǒng)計與統(tǒng)計案例、概率 第3節(jié) 變量間的相關關系與統(tǒng)計案例課件 文 新人教A(39頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第第3節(jié)變量間的相關關系與統(tǒng)計案例節(jié)變量間的相關關系與統(tǒng)計案例最新考綱1.會作兩個有關聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系;2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸方程系數(shù)公式不要求記憶);3.了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應用;4.了解回歸分析的基本思想、方法及其簡單應用.1.相關關系與回歸分析回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法;判斷相關性的常用統(tǒng)計圖是:;統(tǒng)計量有相關系數(shù)與相關指數(shù).(1)在散點圖中,點散布在從到的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.(2)在
2、散點圖中,點散布在從到的區(qū)域,兩個變量的這種相關關系稱為負相關.(3)如果散點圖中點的分布從整體上看大致在 附近,稱兩個變量具有線性相關關系.知知 識識 梳梳 理理散點圖左下角右上角左上角右下角一條直線2.線性回歸方程距離的平方和斜率3.回歸分析(1)定義:對具有的兩個變量進行統(tǒng)計分析的一種常用方法.(2)樣本點的中心:對于一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn),其中稱為樣本點的中心.相關關系(3)相關系數(shù)當r0時,表明兩個變量;當r0時,表明兩個變量.r的絕對值越接近于1,表明兩個變量的線性相關性.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系
3、.通常|r|大于時,認為兩個變量有很強的線性相關性.(4)相關指數(shù):R2.其中 是殘差平方和,其值越小,則R2越大(接近1),模型的擬合效果越好.正相關負相關越強0.754.獨立性檢驗(1)利用隨機變量K2來判斷“兩個分類變量”的方法稱為獨立性檢驗.(2)列聯(lián)表:列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(22列聯(lián)表)為則隨機變量K2 ,其中n為樣本容量. y1y2總計x1abx2cdcd總計 acabcd有關系a+bb+dabcd1.思考辨析(在括號內(nèi)打“”或“”)(1)“名師出高徒”可以解釋為教師的教學水平
4、與學生的水平成正相關關系.()(2)通過回歸直線方程 可以估計預報變量的取值和變化趨勢.()(3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關性檢驗.()(4)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.()答案(1)(2)(3)(4)診診 斷斷 自自 測測2.(必修3P90例題改編)某研究機構對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,所得數(shù)據(jù)如表:答案Cx68 10 12y23563.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關指數(shù)R2如下,其中擬合效果最好的模型是()A.模型1的相關指數(shù)R2為0.98B.模型2的相關指數(shù)R2為0
5、.80C.模型3的相關指數(shù)R2為0.50D.模型4的相關指數(shù)R2為0.25解析在兩個變量y與x的回歸模型中,它們的相關指數(shù)R2越近于1,模擬效果越好,在四個選項中A的相關指數(shù)最大,所以擬合效果最好的是模型1.答案A4.(2015全國卷)根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結論不正確的是()A.逐年比較,2008年減少二氧化硫排放量的效果最顯著B.2007年我國治理二氧化硫排放顯現(xiàn)成效C.2006年以來我國二氧化硫年排放量呈減少趨勢D.2006年以來我國二氧化硫年排放量與年份正相關解析對于A選項,由圖知從2007年到2008年二氧化硫排放量下降得最多
6、,故A正確.對于B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關,D不正確.答案D5.為了判斷高中三年級學生是否選修文科與性別的關系,現(xiàn)隨機抽取50名學生,得到如下22列聯(lián)表: 理科 文科男1310女720解析K2的觀測值k4.844,這表明小概率事件發(fā)生.根據(jù)假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷出錯的可能性約為5%.答案5%考點一相關關系的判斷考點一相關關系的判斷【例1】 (1)已知變
7、量x和y近似滿足關系式y(tǒng)0.1x1,變量y與z正相關.下列結論中正確的是()A.x與y正相關,x與z負相關B.x與y正相關,x與z正相關C.x與y負相關,x與z負相關D.x與y負相關,x與z正相關(2)甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m如下表:則哪位同學的試驗結果體現(xiàn)A,B兩變量有更強的線性相關性()A.甲 B.乙 C.丙 D.丁 甲乙丙丁r0.82 0.78 0.69 0.85m106115124103解析(1)由y0.1x1,知x與y負相關,即y隨x的增大而減小,又y與z正相關,所以z隨y的增大而增大,減小而減小,所
8、以z隨x的增大而減小,x與z負相關.(2)在驗證兩個變量之間的線性相關關系時,相關系數(shù)的絕對值越接近于1,相關性越強,在四個選項中只有丁的相關系數(shù)最大;殘差平方和越小,相關性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結果體現(xiàn)了A,B兩變量有更強的線性相關性.答案(1)C(2)D【訓練1】 (1)某公司在2018年上半年的收入x(單位:萬元)與月支出y(單位:萬元)的統(tǒng)計資料如下表所示:根據(jù)統(tǒng)計資料,則()A.月收入的中位數(shù)是15,x與y有正線性相關關系B.月收入的中位數(shù)是17,x與y有負線性相關關系C.月收入的中位數(shù)是16,x與y有正線性相關關系D.月收入的中位數(shù)是16,x與y有負線性相關
9、關系月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18(2)x和y的散點圖如圖所示,則下列說法中所有正確命題的序號為_.答案(1)C(2)考點二線性回歸方程及應用考點二線性回歸方程及應用【例2】 (2015全國卷)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的年宣傳費xi和年銷售量yi(i1,2,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.故年宣傳費為46.24千元時,年利潤的預報值最大.【訓練
10、2】 (2018日照調研)某地隨著經(jīng)濟的發(fā)展,居民收入逐年增長,下表是該地一建設銀行連續(xù)五年的儲蓄存款(年底余額),如下表1:為了研究計算的方便,工作人員將上表的數(shù)據(jù)進行了處理,tx2 012,zy5得到下表2:年份x20132014201520162017儲蓄存款y(千億元)567810表1時間代號t12345z01235表2所以預測到2022年年底,該地儲蓄存款額可達15.6千億元.考點三獨立性檢驗考點三獨立性檢驗【例3】 (2017全國卷)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:(1)
11、記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,估計A的概率;(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關;(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對這兩種養(yǎng)殖方法的優(yōu)劣進行比較.附: 箱產(chǎn)量6.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關. 箱產(chǎn)量50 kg箱產(chǎn)量50 kg舊養(yǎng)殖法6238新養(yǎng)殖法3466(3)箱產(chǎn)量的頻率分布直方圖表明:新養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在50 kg到55 kg之間,舊養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在45 kg到50 kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高.因此,可以認為新養(yǎng)殖法的箱產(chǎn)量較
12、高且穩(wěn)定,從而新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法.【訓練3】 (2018合肥質檢)某校在高一年級學生中,對自然科學類、社會科學類校本選修課程的選課意向進行調查. 現(xiàn)從高一年級學生中隨機抽取180名學生,其中男生105名;在這180名學生中選擇社會科學類的男生、女生均為45名.(1)試問:從高一年級學生中隨機抽取1人,抽到男生的概率約為多少?(2)根據(jù)抽取的180名學生的調查結果,完成下面的22列聯(lián)表.并判斷能否在犯錯誤的概率不超過0.025的前提下認為科類的選擇與性別有關? 選擇自然科學類選擇社會科學類合計男生 女生 合計 P(K2k0)0.5000.4000.250 0.150 0.100 0.0500.0250.0100.0050.001k00.4550.7081.323 2.072 2.706 3.8415.0246.6357.87910.828(2)根據(jù)統(tǒng)計數(shù)據(jù),可得22列聯(lián)表如下:所以能在犯錯誤的概率不超過0.025的前提下認為科類的選擇與性別有關. 選擇自然科學類選擇社會科學類合計男生6045105女生304575合計9090180