《高三數(shù)學(xué)一輪復(fù)習(xí) 第十二章 統(tǒng)計(jì) 第75課 變量的相關(guān)性與統(tǒng)計(jì)案例學(xué)案 文》由會(huì)員分享,可在線閱讀,更多相關(guān)《高三數(shù)學(xué)一輪復(fù)習(xí) 第十二章 統(tǒng)計(jì) 第75課 變量的相關(guān)性與統(tǒng)計(jì)案例學(xué)案 文(10頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第75課 變量的相關(guān)性與統(tǒng)計(jì)案例
1. 兩個(gè)變量的線性相關(guān)
(1)正相關(guān):在散點(diǎn)圖中,點(diǎn)散布在從左下角到右上角的區(qū)域,對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為正相關(guān).
(2)負(fù)相關(guān):在散點(diǎn)圖中,點(diǎn)散布在從左上角到右下角的區(qū)域, 對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將它稱為負(fù)相關(guān).
(3)相關(guān)系數(shù)r=,當(dāng)r>0時(shí),兩變量正相關(guān),當(dāng)r<0時(shí),兩變量負(fù)相關(guān),當(dāng)|r|≤1且|r|越接近于1,相關(guān)程度越高,當(dāng)|r|≤1且|r|越接近于0,相關(guān)程度越低.
(4)線性相關(guān)關(guān)系、回歸直線
如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,就稱這兩個(gè)變量之間具有線性相關(guān)關(guān)系,這條直線叫做回
2、歸直線.
2.回歸方程
(1)最小二乘法:求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方和最小的方法叫做最小二乘法.
(2)回歸方程:方程是兩個(gè)具有線性相關(guān)關(guān)系的變的一組數(shù)據(jù) , , … , )的回歸方程,其中是待定參數(shù).
,
3.兩個(gè)分類變量的獨(dú)立性檢驗(yàn)的一般步驟:
(1)列出兩個(gè)分類變量的列聯(lián)表:
(2)假設(shè)兩個(gè)分類變量無(wú)關(guān)系;
(3)計(jì)算(其中為樣本容量);
(4)把的值與臨界值比較,確定有關(guān)的程度或無(wú)關(guān)系.
【例1】對(duì)變量有觀測(cè)數(shù)據(jù),得散點(diǎn)圖⑴;對(duì)變量有觀測(cè)數(shù)據(jù),得散點(diǎn)圖⑵. 由這兩個(gè)散點(diǎn)圖可以判斷( ?。?
A.變量與正相
3、關(guān),與正相關(guān) B.變量與正相關(guān),與負(fù)相關(guān)
C.變量與負(fù)相關(guān),與正相關(guān) D.變量與負(fù)相關(guān),與負(fù)相關(guān)
【變式】為了解某商品銷售量(件)與銷售價(jià)格(元/件)的關(guān)系,統(tǒng)計(jì)了的10組值,并畫成散點(diǎn)圖如圖,則其回歸方程可能是( )
A.
B.
C.
D.
【例2】(2020新課標(biāo)II卷)某地區(qū)2020年至2020年農(nóng)村居民家庭人均純收入(單位:千元)的數(shù)據(jù)如下表:
年份
2020
2020
2020
2020
2020
2020
2020
年份代號(hào)t
1
2
3
4
5
6
7
人均純收入y
2.9
3.3
3.6
4.4
4.
4、8
5.2
5.9
(Ⅰ)求關(guān)于的線性回歸方程;
(Ⅱ)利用(Ⅰ)中的回歸方程,分析2020年至2020年
該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,
并預(yù)測(cè)該地區(qū)2020年農(nóng)村居民家庭人均純收入.
附:回歸直線的斜率和截距的最小二乘估計(jì)公式分別為:
【解析】(Ⅰ)由所給數(shù)據(jù)計(jì)算得:,
,
,
==,
,,
所求回歸方程為.
(Ⅱ)由(Ⅰ)由知,,故年至年該地區(qū)農(nóng)村居民家庭人均純收入逐 年增加,平均每年增加千元.
將年的年份代號(hào)代入(Ⅰ)中的回歸方程,得,
故預(yù)測(cè)該地區(qū)年農(nóng)村居民家庭人均純收入為千元.
【變式】 (2020江門一模)某產(chǎn)品的廣
5、告費(fèi)用與銷售額的統(tǒng)計(jì)數(shù)據(jù)如下表:
根據(jù)上表數(shù)據(jù)用最小二乘法求得關(guān)于的線性回歸方程中,,則據(jù)此模型預(yù)測(cè),廣告費(fèi)用為萬(wàn)元時(shí),銷售額約為 .
【答案】萬(wàn)元
【解析】∵,,
∴,
∴廣告費(fèi)用為萬(wàn)元時(shí),銷售額約為(萬(wàn)元).
【例3】今年春節(jié)黃金周,記者通過(guò)隨機(jī)詢問(wèn)某景區(qū)110名游客對(duì)景區(qū)的服務(wù)是否滿意,得到如下的列聯(lián)表:
性別與對(duì)景區(qū)的服務(wù)是否滿意(單位:名).
(1)從這50名女游客中按對(duì)景區(qū)的服務(wù)是否滿意采取分層抽樣,抽取一個(gè)容量為5的樣本,問(wèn)樣本中滿意與不滿意的女游客各有多少名?
(2)從(1)中的5名女游客樣本中隨機(jī)選取兩名作深度訪談,求選到滿意與不滿意的女
6、游客各一名的概率;
(3)根據(jù)以上列聯(lián)表,問(wèn)有多大把握認(rèn)為“游客性別與對(duì)景區(qū)的服務(wù)滿意”有關(guān).
【解析】(1)由題意,樣本中滿意的女游客為名,
不滿意的女游客為名.
(2)記樣本中對(duì)景區(qū)的服務(wù)滿意的3名女游客分別為,對(duì)景區(qū)的服務(wù)不滿意的2名女游客分別為.
從5名女游客中隨機(jī)選取兩名,共有10個(gè)基本事件,分別為,,,,.
其中事件:選到滿意與不滿意的女游客各一名包含了6個(gè)基本事件,分別為,,,
∴所求概率.
(3)假設(shè):該景區(qū)游客性別與對(duì)景區(qū)的服務(wù)滿意無(wú)關(guān),則應(yīng)該很?。?
根據(jù)題目中列聯(lián)表得:.
由可知:有99%的把握認(rèn)為該景區(qū)游客性別與對(duì)景區(qū)的服務(wù)滿意有關(guān).
【變式】以
7、下四個(gè)命題: ①在一次試卷分析中,從每個(gè)試室中抽取第5號(hào)考生的成績(jī)進(jìn)行統(tǒng)計(jì),是簡(jiǎn)單隨機(jī)抽樣;②樣本數(shù)據(jù):,,,,的方差為;③對(duì)于相關(guān)系數(shù),越接近,則線性相關(guān)程度越強(qiáng);④通過(guò)隨機(jī)詢問(wèn)名性別不同的行人,對(duì)過(guò)馬路是愿意走斑馬線還是愿意走人行天橋進(jìn)行抽樣調(diào)查,得到如下列聯(lián)表:
由可得,
, 附表
則有在犯錯(cuò)誤率不超過(guò)的條件下認(rèn)為“選擇過(guò)馬路方式與性別有關(guān)”.其中正確的命題序號(hào)是 .
第75課 變量的相關(guān)性與統(tǒng)計(jì)案例的后作業(yè)
1.在回歸分析中,殘差圖中縱坐標(biāo)為( )
A.殘差 B.樣本編號(hào) C. D.
【答案
8、】A
2.(2020韶關(guān)一模)已知回歸直線的斜率的估計(jì)值為,樣本點(diǎn)的中心為,則回歸直線方程為( )
A. B. ?C.? D.
【答案】C
【解析】依題意可得, ∴ ,∴ .
3.已知與之間的一組數(shù)據(jù):則與的線性回歸方程必過(guò)點(diǎn) ( )
A. B. C. D.
【答案】D
【解析】,.
4.對(duì)四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是 ( )
A. B. C. D.
【答案】A
【解析】易知題中圖(1)與圖(
9、3)是正相關(guān),圖(2)與圖(4)是負(fù)相關(guān),且圖(1)與圖(2)中的樣本點(diǎn)集中分布在一條直線附近,則.
5. (2020·江西高考)某人研究中學(xué)生的性別與成績(jī)、視力、智商、閱讀量這4個(gè)變量之間的關(guān)系,隨機(jī)抽查52名中學(xué)生,得到統(tǒng)計(jì)數(shù)據(jù)如表1至表4,則與性別有關(guān)聯(lián)的可能性最大的變量是( )
A.成績(jī) B.視力 C.智商 D.閱讀量
【答案】D
【解析】因?yàn)镵==,K==,K==,K==,則有K>K>K>K,所以閱讀量與性別關(guān)聯(lián)的可能性最大.
6.某班主任對(duì)全班30名男生進(jìn)行了作業(yè)量多少的調(diào)查,數(shù)據(jù)如下
10、表:該班主任據(jù)此推斷男生認(rèn)為作業(yè)多與喜歡玩電腦游戲有關(guān)系,則這種推斷犯錯(cuò)誤的概率不超過(guò)________.
【答案】
【解析】計(jì)算得 的觀測(cè)值為,則推斷犯錯(cuò)誤的概率不超過(guò) .
7.某數(shù)學(xué)老師身高176 cm,他爺爺、父親和兒子的身高分別是173 cm、170 cm和182 cm.因兒子的身高與父親的身高有關(guān),該老師用線性回歸分析的方法預(yù)測(cè)他孫子的身高為_(kāi)_______ cm.
【答案】
【解析】?jī)鹤雍透赣H的身高可列表如下:
父親身高
173
170
176
兒子身高
170
176
182
設(shè)線性回歸方程為,由表中的三組數(shù)據(jù)可求得,且過(guò)中心點(diǎn),故,故線性回歸方程為,
11、將代入得孫子的身高為cm.
8.從某居民區(qū)隨機(jī)抽取10個(gè)家庭,獲得第個(gè)家庭的月收入(單位:千元)與月儲(chǔ)蓄(單位:千元)的數(shù)據(jù)資料,算得,,,.
(1)求家庭的月儲(chǔ)蓄對(duì)月收入的線性回歸方程;
(2)判斷變量與之間是正相關(guān)還是負(fù)相關(guān),并說(shuō)明這10個(gè)家庭月儲(chǔ)蓄對(duì)于月收入的變化情況;
(3)若該居民區(qū)某家庭月收入為7千元,預(yù)測(cè)該家庭的月儲(chǔ)蓄.
附:線性回歸方程中,,, 其中,為樣本平均值.
9. 某中學(xué)研究性學(xué)習(xí)小組,為了研究高中學(xué)生的作文水平是否與愛(ài)看課外書有關(guān)系,在本校高三年級(jí)隨機(jī)調(diào)查了50名學(xué)生.調(diào)查結(jié)果表明:在愛(ài)看課外書的25人中有18人作文水平好,另外
12、7人作文水平一般;在不愛(ài)看課外書的25人中有6人作文水平好,另外19人作文水平一般.
(1)試根據(jù)以上數(shù)據(jù)完成以下2×2列聯(lián)表,并運(yùn)用獨(dú)立性檢驗(yàn)思想,指出有多大把握認(rèn)為高中學(xué)生的作文水平與愛(ài)看課外書有關(guān)系;
愛(ài)看課外書
不愛(ài)看課外書
總計(jì)
作文水平好
作文水平一般
總計(jì)
(2)將其中某5名愛(ài)看課外書且作文水平好的學(xué)生分別編號(hào)為1,2,3,4,5,某5名愛(ài)看課外書且作文水平一般的學(xué)生也分別編號(hào)為1,2,3,4,5,從這兩組學(xué)生中各任選1人進(jìn)行學(xué)習(xí)交流,求被選取的2名學(xué)生的編號(hào)之和為3的倍數(shù)或4的倍數(shù)的概率.
參考公式:,其中.
參考數(shù)據(jù)
13、:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【解析】(1)2×2列聯(lián)表如下:
愛(ài)看課外書
不愛(ài)看課外書
總計(jì)
作文水平好
18
6
24
作文水平一般
7
19
26
總計(jì)
25
25
50
因?yàn)?
由表知 ,
所以有 的把握認(rèn)為高中學(xué)生的作文水平與愛(ài)看課外書有關(guān)系.
(2)設(shè)“被選取的2名學(xué)生的編號(hào)之和為3的倍數(shù)”為事件,“被選取的2名學(xué)生的編號(hào)之和為4的倍數(shù)”為事件.
則基本事件為
1
2
3
4
14、
5
1
(1,1)
(1,2)
(1,3)
(1,4)
(1,5)
2
(2,1)
(2,2)
(2,3)
(2,4)
(2,5)
3
(3,1)
(3,2)
(3,3)
(3,4)
(3,5)
4
(4,1)
(4,2)
(4,3)
(4,4)
(4,5)
5
(5,1)
(5,2)
(5,3)
(5,4)
(5,5)
共25個(gè),
因?yàn)槭录幕臼录?1,2),(1,5),(2,1),(2,4),(3,3),(4,2),(4,5),(5,1),(5,4),共9個(gè),所以 ;事件所包含的基本事件為(1,3),(2,2),(
15、3,1),(3,5),(4,4),(5,3),共6個(gè),所以.
因?yàn)槭录?、互斥,所?,
即被選取的2名學(xué)生的編號(hào)之和為3的倍數(shù)或4的倍數(shù)的概率為.
轎車A
轎車B
轎車C
舒適型
100
150
z
標(biāo)準(zhǔn)型
300
450
600
10.一汽車廠生產(chǎn)A,B,C三類轎車,每類轎車均有舒適型和標(biāo)準(zhǔn)型兩種型號(hào),某月的產(chǎn)量如下表(單位:輛):
按類用分層抽樣的方法在這個(gè)月生產(chǎn)的轎車中抽取50輛,其中有A類轎車10輛.
(1)求z的值;
(2)用分層抽樣的方法在C類轎車中抽取一個(gè)容量為5的樣本.將該樣本看成一個(gè)總體,從中任取2輛,求至少有1輛舒適型轎車的概率;
(
16、3)用隨機(jī)抽樣的方法從B類舒適型轎車中抽取8輛,經(jīng)檢測(cè)它們的得分如下:
9.4 ,8.6 ,9.2 ,9.6 ,8.7 ,9.3 ,9.0 ,8.2,把這8輛轎車的得分看成一個(gè)總體,從中任取一個(gè)數(shù),求該數(shù)與樣本平均數(shù)之差的絕對(duì)值不超過(guò)0.5的概率.
【解析】(1)設(shè)該廠這個(gè)月共生產(chǎn)轎車n輛,由題意得,所以,
則 .
(2)設(shè)所抽樣本中有a輛舒適型轎車,由題意得,則.
因此抽取的容量為5的樣本中,有2輛舒適型轎車,3輛標(biāo)準(zhǔn)型轎車.用A1,A2表示2輛舒適型轎車,用B1,B2,B3表示3輛標(biāo)準(zhǔn)型轎車,用E表示事件“在該樣本中任取2輛,其中至少有1輛舒適型轎車”,則基本事件空間包含的基本事
17、件有:
(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),共10個(gè).
事件E包含的基本事件有:
(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),共7個(gè).故P(E)=,即所求概率為.
(3)樣本平均數(shù)=(9.4+8.6+9.2+9.6+8.7+9.3+9.0+8.2)=9.
設(shè)D表示事件“從樣本中任取一個(gè)數(shù),該數(shù)與樣本平均數(shù)之差的絕對(duì)值不超過(guò)0.5”,則基本事件空間中有8個(gè)基本事件,事件D包含的基本事件有9.4,8.6,9.2,8.7,9.3,9.0,共6個(gè),所以P(D)==,即所求概率為.