《2020屆高考數(shù)學(xué)一輪總復(fù)習(xí) 第十單元 計(jì)數(shù)原理 、概率與統(tǒng)計(jì) 第79講 變量的相關(guān)性、回歸分析、獨(dú)立性檢驗(yàn)練習(xí) 理(含解析)新人教A版》由會(huì)員分享,可在線閱讀,更多相關(guān)《2020屆高考數(shù)學(xué)一輪總復(fù)習(xí) 第十單元 計(jì)數(shù)原理 、概率與統(tǒng)計(jì) 第79講 變量的相關(guān)性、回歸分析、獨(dú)立性檢驗(yàn)練習(xí) 理(含解析)新人教A版(7頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第79講 變量的相關(guān)性、回歸分析、獨(dú)立性檢驗(yàn)
1.設(shè)某大學(xué)的女生的體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為y =0.85x-85.71,則下列結(jié)論中不正確的是(D)
A.y與x具有正的線性相關(guān)關(guān)系
B.回歸直線過(guò)樣本點(diǎn)的中心(,)
C.若該大學(xué)某女生的身高增加1 cm,則其體重約增加0.85 kg
D.若該大學(xué)某女生的身高為170 cm,則可斷定其體重必為58.79 kg
A、B、C均正確,是回歸方程的性質(zhì).D項(xiàng)是錯(cuò)誤的,線性回歸方程只能預(yù)測(cè)學(xué)生的體重,選項(xiàng)D應(yīng)改為“若該大學(xué)
2、某女生身高為170 cm,則估計(jì)其體重大約為58.79 kg”才正確.
2.(2017·山東卷)為了研究某班學(xué)生的腳長(zhǎng)x(單位:厘米)和身高y(單位:厘米)的關(guān)系,從該班隨機(jī)抽取10名學(xué)生,根據(jù)測(cè)量數(shù)據(jù)的散點(diǎn)圖可以看出y與x之間有線性相關(guān)關(guān)系.設(shè)其回歸直線方程為y =b x+a .已知i=225,i=1 600,b =4.該班某學(xué)生的腳長(zhǎng)為24,據(jù)此估計(jì)其身高為(C)
A.160 B.163
C.166 D.170
因?yàn)閕=225,所以=i=22.5.
因?yàn)閕=1 600,所以=i=160.
又b =4,所以a =-b =160-4×22.5=70.
所以回歸直線方程為y
3、 =4x+70.
將x=24代入上式得y =4×24+70=166.
3.下列關(guān)于K2的說(shuō)法中正確的是(C)
A.K2在任何相互獨(dú)立問(wèn)題中都可以用于檢驗(yàn)有關(guān)還是無(wú)關(guān)
B.K2的值越大,兩個(gè)事件的相關(guān)性就越大
C.K2是用來(lái)判斷兩個(gè)分類(lèi)變量是否有關(guān)系的隨機(jī)變量,只對(duì)兩個(gè)分類(lèi)變量適合
D.K2的觀測(cè)值的計(jì)算公式為
k=
4.通過(guò)隨機(jī)詢(xún)問(wèn)110名性別不同的大學(xué)生是否愛(ài)好某項(xiàng)運(yùn)動(dòng),得到如下的列聯(lián)表:
男
女
總計(jì)
愛(ài)好
40
20
60
不愛(ài)好
20
30
50
總計(jì)
60
50
110
由K2=算得,
K2=≈7.8.
附表:
P(K
4、2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
參照附表,得到的正確結(jié)論是(A)
A.有99%以上的把握認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”
B.有99%以上的把握認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別無(wú)關(guān)”
C.在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”
D.在犯錯(cuò)誤的概率不超過(guò)0.1%的前提下,認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別無(wú)關(guān)”
解:因?yàn)?.8>6.635,所以99%以上的把握認(rèn)為“愛(ài)好該項(xiàng)運(yùn)動(dòng)與性別有關(guān)”,選A.
5.對(duì)于一組數(shù)據(jù)的兩個(gè)函數(shù)模型,模型Ⅰ和模型Ⅱ的殘差平方和分別為180.2和290.7,若從中選取一個(gè)擬合
5、程度較好的函數(shù)模型,應(yīng)選 模型Ⅰ .
解:殘差平方和越小,函數(shù)模型對(duì)數(shù)據(jù)的擬合效果越好;殘差平方和越大,說(shuō)明函數(shù)模型對(duì)數(shù)據(jù)的擬合效果越差.
6.已知x、y的取值如下表所示,
x
0
1
3
4
y
2.2
4.3
4.8
6.7
從所得的散點(diǎn)圖分析,y與x線性相關(guān),且y=0.95x+a,則a= 2.6 .
解:因?yàn)榛貧w直線方程必過(guò)樣本點(diǎn)的中心(,),
由表中數(shù)據(jù)得=2,=4.5,將(2,4.5)代入y=0.95x+a,可得a=2.6.
7.(2018·全國(guó)卷Ⅱ)下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖.
為了預(yù)測(cè)該地
6、區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時(shí)間變量t的兩個(gè)線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,…,17)建立模型①:=-30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時(shí)間變量t的值依次為1,2,…,7)建立模型②:=99+17.5t.
(1)分別利用這兩個(gè)模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值.
(2)你認(rèn)為用哪個(gè)模型得到的預(yù)測(cè)值更可靠?并說(shuō)明理由.
(1)利用模型①,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測(cè)值為=-30.4+13.5×19=226.1(億元).
利用模型②,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資
7、額的預(yù)測(cè)值為=99+17.5×9=256.5(億元).
(2)利用模型②得到的預(yù)測(cè)值更可靠.
理由如下:
(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)沒(méi)有隨機(jī)散布在直線y=-30.4+13.5t上下,這說(shuō)明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢(shì).2010年相對(duì)2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對(duì)應(yīng)的點(diǎn)位于一條直線的附近,這說(shuō)明從2010年開(kāi)始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線性增長(zhǎng)趨勢(shì),利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)
8、設(shè)施投資額的變化趨勢(shì),因此利用模型②得到的預(yù)測(cè)值更可靠.
(ii)從計(jì)算結(jié)果看,相對(duì)于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型①得到的預(yù)測(cè)值226.1億元的增幅明顯偏低,而利用模型②得到的預(yù)測(cè)值的增幅比較合理,說(shuō)明利用模型②得到的預(yù)測(cè)值更可靠.
(以上給出了2種理由,考生答出其中任意一種或其他合理理由均可得分)
8.一車(chē)間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了8次試驗(yàn),收集的數(shù)據(jù)如下表:
零件數(shù)x(個(gè))
10
20
30
40
加工時(shí)間y(min)
62
68
75
81
零件數(shù)x(個(gè))
50
60
70
80
加工時(shí)間y(
9、min)
89
95
102
108
設(shè)回歸方程為y =bx+a,則點(diǎn)(a,b)在直線x+45y-10=0的(C)
A.左上方 B.左下方
C.右上方 D.右下方
解:由=45,=85,得a+45b=85,即有a+45b-10>0,故點(diǎn)(a,b)在直線x+45y-10=0的右上方,故選C.
9.某醫(yī)療研究所為了了解某種血清預(yù)防感冒的作用,把500名使用過(guò)這種血清的人與另外500名未使用這種血清的人一年中的感冒記錄比較,提出假設(shè)H0:“這種血清不能起到預(yù)防感冒的作用”,利用2×2列聯(lián)表計(jì)算得K2=3.918,經(jīng)查臨界值表知P(K2≥3.841)≈0.05.由下列結(jié)論中,正確
10、結(jié)論的序號(hào)是?、佟?
①有95%的把握認(rèn)為“這種血清能起到預(yù)防感冒的作用”;
②若某人未使用該血清,那么他在一年中有95%的可能性得感冒;
③這種血清預(yù)防感冒的有效率為95%;
④這種血清預(yù)防感冒的有效率為5%.
解:因?yàn)镵2=3.918≥3.841,而P(K2≥3.841)≈0.05,
所以有95%的把握認(rèn)為“這種血清能起到預(yù)防感冒的作用”.
10.(2018·佛山一模)有甲、乙兩家公司都愿意聘用某求職者,這兩家公式的具體聘用信息如下:
甲公司 :
職位
A
B
C
D
月薪/元
6000
7000
8000
9000
獲得相應(yīng)職位概率
0.4
11、
0.3
0.2
0.1
乙公司:
職位
A
B
C
D
月薪/元
5000
7000
9000
11000
獲得相應(yīng)職位概率
0.4
0.3
0.2
0.1
(1)根據(jù)以上信息,如果你是該求職者,你會(huì)選擇哪一家公司?說(shuō)明理由;
(2)某課外實(shí)習(xí)作業(yè)小組調(diào)查了1000名職場(chǎng)人士,就選擇這兩家公司的意愿作了統(tǒng)計(jì),得到如下數(shù)據(jù)分布:
人員結(jié)構(gòu)
選擇意愿
40歲以上
(含40歲)
男性
40歲以上
(含40歲)
女性
40歲以下
男性
40歲以下
女性
選擇甲公司
110
120
140
80
選
12、擇乙公司
150
90
200
110
若分析選擇意愿與年齡這兩個(gè)分類(lèi)變量,計(jì)算得到的K2的觀測(cè)值為k1=5.5513,測(cè)得出“選擇意愿與年齡有關(guān)系”的結(jié)論犯錯(cuò)誤的概率的上限是多少?并用統(tǒng)計(jì)學(xué)知識(shí)分析,選擇意愿與年齡變量和性別變量哪一個(gè)關(guān)聯(lián)性更大?
附:K2=
P(K2≥k)
0.050
0.025
0.010
0.005
k
3.841
5.024
6.635
7.879
(1)設(shè)甲公司與乙公司的月薪分別為隨機(jī)變量X,Y,
則E(X)=6000×0.4+7000×0.3+8000×0.2+9000×0.1=7000,
E(Y)=5000×0.4+700
13、0×0.3+9000×0.2+11000×0.1=7000,
D(X)=(6000-7000)2×0.4+(7000-7000)2×0.3+(8000-7000)2×0.2+(9000-7000)2×0.1=10002,
D(Y)=(5000-7000)2×0.4+(7000-7000)2×0.3+(9000-7000)2×0.2+(11000-7000)2×0.1=20002,
則E(X)=E(Y),D(X)<D(Y),
我希望不同職位的月薪差距小一些,故選擇甲公司;
或我希望不同職位的月薪差距大一些,故選擇乙公司.
(2)因?yàn)閗1=5.5513>5.024,根據(jù)表中對(duì)應(yīng)值,
得出“選擇意愿與年齡有關(guān)系”的結(jié)論犯錯(cuò)的概率的上限是0.025,
由數(shù)據(jù)分布可得選擇意愿與性別兩個(gè)分類(lèi)變量的2×2列聯(lián)表如下:
選擇甲公司
選擇乙公司
總計(jì)
男
250
350
600
女
200
200
400
總計(jì)
450
550
1000
計(jì)算K2==≈6.734,
且K2=6.734>6.635,
對(duì)照臨界值表得出結(jié)論“選擇意愿與性別有關(guān)”的犯錯(cuò)誤的概率上限為0.01,由0.01<0.025,所以與年齡相比,選擇意愿與性別關(guān)聯(lián)性更大.
7