《(全國通用版)2019版高考數(shù)學大一輪復(fù)習 第十章 統(tǒng)計與統(tǒng)計案例、概率 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例課件 文 新人教A版.ppt》由會員分享,可在線閱讀,更多相關(guān)《(全國通用版)2019版高考數(shù)學大一輪復(fù)習 第十章 統(tǒng)計與統(tǒng)計案例、概率 第3節(jié) 變量間的相關(guān)關(guān)系與統(tǒng)計案例課件 文 新人教A版.ppt(38頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第3節(jié)變量間的相關(guān)關(guān)系與統(tǒng)計案例,最新考綱1.會作兩個有關(guān)聯(lián)變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關(guān)關(guān)系;2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(線性回歸方程系數(shù)公式不要求記憶);3.了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應(yīng)用;4.了解回歸分析的基本思想、方法及其簡單應(yīng)用.,1.相關(guān)關(guān)系與回歸分析,回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法;判斷相關(guān)性的常用統(tǒng)計圖是:;統(tǒng)計量有相關(guān)系數(shù)與相關(guān)指數(shù). (1)在散點圖中,點散布在從到的區(qū)域,對于兩個變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān). (2)在散點圖中,點散布在從
2、到的區(qū)域,兩個變量的這種相關(guān)關(guān)系稱為負相關(guān). (3)如果散點圖中點的分布從整體上看大致在 附近,稱兩個變量具有線性相關(guān)關(guān)系.,知 識 梳 理,散點圖,左下角,右上角,左上角,右下角,一條直線,2.線性回歸方程,距離的平方和,斜率,3.回歸分析,(1)定義:對具有的兩個變量進行統(tǒng)計分析的一種常用方法. (2)樣本點的中心:對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),,(xn,yn),其中稱為樣本點的中心.,相關(guān)關(guān)系,(3)相關(guān)系數(shù) 當r0時,表明兩個變量; 當r<0時,表明兩個變量. r的絕對值越接近于1,表明兩個變量的線性相關(guān)性. r的絕對值越接近于0,表明兩個變量之間幾乎不
3、存在線性相關(guān)關(guān)系.通常|r|大于時,認為兩個變量有很強的線性相關(guān)性. (4)相關(guān)指數(shù):R2.其中 是殘差平方和,其值越小,則R2越大(接近1),模型的擬合效果越好.,正相關(guān),負相關(guān),越強,0.75,4.獨立性檢驗,(1)利用隨機變量K2來判斷“兩個分類變量”的方法稱為獨立性檢驗. (2)列聯(lián)表:列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假設(shè)有兩個分類變量X和Y,它們的可能取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(22列聯(lián)表)為,則隨機變量K2 ,其中n為樣本容量.,,,有關(guān)系,a+b,b+d,abcd,1.思考辨析(在括號內(nèi)打“”或“”) (1)“名師出高徒”可以解釋為
4、教師的教學水平與學生的水平成正相關(guān)關(guān)系.() (2)通過回歸直線方程 可以估計預(yù)報變量的取值和變化趨勢.() (3)因為由任何一組觀測值都可以求得一個線性回歸方程,所以沒有必要進行相關(guān)性檢驗.() (4)事件X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.() 答案(1)(2)(3)(4),診 斷 自 測,2.(必修3P90例題改編)某研究機構(gòu)對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,所得數(shù)據(jù)如表:,答案C,3.兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的相關(guān)指數(shù)R2如下,其中擬合效果最好的模型是() A.模型1的相關(guān)指數(shù)R2為0.98 B.模型2的相關(guān)指數(shù)R
5、2為0.80 C.模型3的相關(guān)指數(shù)R2為0.50 D.模型4的相關(guān)指數(shù)R2為0.25 解析在兩個變量y與x的回歸模型中,它們的相關(guān)指數(shù)R2越近于1,模擬效果越好,在四個選項中A的相關(guān)指數(shù)最大,所以擬合效果最好的是模型1. 答案A,4.(2015全國卷)根據(jù)下面給出的2004年至2013年我國二氧化硫年排放量(單位:萬噸)柱形圖,以下結(jié)論不正確的是(),A.逐年比較,2008年減少二氧化硫排放量的效果最顯著 B.2007年我國治理二氧化硫排放顯現(xiàn)成效 C.2006年以來我國二氧化硫年排放量呈減少趨勢 D.2006年以來我國二氧化硫年排放量與年份正相關(guān),解析對于A選項,由圖知從2007年到2008
6、年二氧化硫排放量下降得最多,故A正確.對于B選項,由圖知,由2006年到2007年矩形高度明顯下降,因此B正確.對于C選項,由圖知從2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C正確.由圖知2006年以來我國二氧化硫年排放量與年份負相關(guān),D不正確. 答案D,5.為了判斷高中三年級學生是否選修文科與性別的關(guān)系,現(xiàn)隨機抽取50名學生,得到如下22列聯(lián)表:,解析K2的觀測值k4.844,這表明小概率事件發(fā)生.根據(jù)假設(shè)檢驗的基本原理,應(yīng)該斷定“是否選修文科與性別之間有關(guān)系”成立,并且這種判斷出錯的可能性約為5%. 答案5%,考點一相關(guān)關(guān)系的判斷,【例1】 (1)已知變量x和y近似
7、滿足關(guān)系式y(tǒng)0.1x1,變量y與z正相關(guān).下列結(jié)論中正確的是() A.x與y正相關(guān),x與z負相關(guān) B.x與y正相關(guān),x與z正相關(guān) C.x與y負相關(guān),x與z負相關(guān) D.x與y負相關(guān),x與z正相關(guān),(2)甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關(guān)性做試驗,并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:,則哪位同學的試驗結(jié)果體現(xiàn)A,B兩變量有更強的線性相關(guān)性() A.甲 B.乙 C.丙 D.丁,解析(1)由y0.1x1,知x與y負相關(guān),即y隨x的增大而減小,又y與z正相關(guān),所以z隨y的增大而增大,減小而減小,所以z隨x的增大而減小,x與z負相關(guān). (2)在驗證兩個變量之間的線性相關(guān)
8、關(guān)系時,相關(guān)系數(shù)的絕對值越接近于1,相關(guān)性越強,在四個選項中只有丁的相關(guān)系數(shù)最大;殘差平方和越小,相關(guān)性越強,只有丁的殘差平方和最小,綜上可知丁的試驗結(jié)果體現(xiàn)了A,B兩變量有更強的線性相關(guān)性. 答案(1)C(2)D,【訓(xùn)練1】 (1)某公司在2018年上半年的收入x(單位:萬元)與月支出y(單位:萬元)的統(tǒng)計資料如下表所示:,根據(jù)統(tǒng)計資料,則() A.月收入的中位數(shù)是15,x與y有正線性相關(guān)關(guān)系 B.月收入的中位數(shù)是17,x與y有負線性相關(guān)關(guān)系 C.月收入的中位數(shù)是16,x與y有正線性相關(guān)關(guān)系 D.月收入的中位數(shù)是16,x與y有負線性相關(guān)關(guān)系,(2)x和y的散點圖如圖所示,則下列說法中所有正確
9、命題的序號為________.,答案(1)C(2),考點二線性回歸方程及應(yīng)用,【例2】 (2015全國卷)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的年宣傳費xi和年銷售量yi(i1,2,,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.,故年宣傳費為46.24千元時,年利潤的預(yù)報值最大.,【訓(xùn)練2】 (2018日照調(diào)研)某地隨著經(jīng)濟的發(fā)展,居民收入逐年增長,下表是該地一建設(shè)銀行連續(xù)五年的儲蓄存款(年底余額),如下表1:,為了研究計算的方便,工作人員將上表的數(shù)據(jù)進行了處理,tx2 012,zy
10、5得到下表2:,表1,表2,所以預(yù)測到2022年年底,該地儲蓄存款額可達15.6千億元.,考點三獨立性檢驗,【例3】 (2017全國卷)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:,(1)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,估計A的概率; (2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān);,(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對這兩種養(yǎng)殖方法的優(yōu)劣進行比較. 附:,解(1)舊養(yǎng)殖法的箱產(chǎn)量低于50 kg的頻率為(0.0120.0140.0240.0340
11、.040)50.62,因此,事件A的概率估計值為0.62. (2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表:,由于15.7056.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān).,(3)箱產(chǎn)量的頻率分布直方圖表明:新養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在50 kg到55 kg之間,舊養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在45 kg到50 kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高.因此,可以認為新養(yǎng)殖法的箱產(chǎn)量較高且穩(wěn)定,從而新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法.,【訓(xùn)練3】 (2018合肥質(zhì)檢)某校在高一年級學生中,對自然科學類、社會科學類校本選修課程的選課意向進行調(diào)查. 現(xiàn)從高一年級學生中隨機抽取180名學生,其中男生105名;在這180名學生中選擇社會科學類的男生、女生均為45名. (1)試問:從高一年級學生中隨機抽取1人,抽到男生的概率約為多少? (2)根據(jù)抽取的180名學生的調(diào)查結(jié)果,完成下面的22列聯(lián)表.并判斷能否在犯錯誤的概率不超過0.025的前提下認為科類的選擇與性別有關(guān)?,(2)根據(jù)統(tǒng)計數(shù)據(jù),可得22列聯(lián)表如下:,所以能在犯錯誤的概率不超過0.025的前提下認為科類的選擇與性別有關(guān).,