2022高考數(shù)學一輪復習 第10章 算法初步與統(tǒng)計 第4課時 線性回歸分析與統(tǒng)計案例練習 理
《2022高考數(shù)學一輪復習 第10章 算法初步與統(tǒng)計 第4課時 線性回歸分析與統(tǒng)計案例練習 理》由會員分享,可在線閱讀,更多相關《2022高考數(shù)學一輪復習 第10章 算法初步與統(tǒng)計 第4課時 線性回歸分析與統(tǒng)計案例練習 理(12頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、2022高考數(shù)學一輪復習 第10章 算法初步與統(tǒng)計 第4課時 線性回歸分析與統(tǒng)計案例練習 理 1.甲、乙、丙、丁四位同學各自對A,B兩變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數(shù)r如下表: 甲 乙 丙 丁 r -0.82 -0.78 -0.69 -0.85 則哪位同學的試驗結果體現(xiàn)A,B兩變量有更強的線性相關性( ) A.甲 B.乙 C.丙 D.丁 答案 D 2.(2018·湖北七市聯(lián)考)廣告投入對商品的銷售額有較大影響.某電商對連續(xù)5個年度的廣告費x和銷售額y進行統(tǒng)計,得到統(tǒng)計數(shù)據(jù)如下表(單位:萬元): 廣告費x 2
2、 3 4 5 6 銷售額y 29 41 50 59 71 由上表可得回歸方程為=10.2x+,據(jù)此模型,預測廣告費為10萬元時銷售額約為( ) A.101.2萬元 B.108.8萬元 C.111.2萬元 D.118.2萬元 答案 C 解析 根據(jù)統(tǒng)計數(shù)據(jù)表,可得=×(2+3+4+5+6)=4,=×(29+41+50+59+71)=50,而回歸直線=10.2x+經(jīng)過樣本點的中心(4,50),∴50=10.2×4+,解得=9.2,∴回歸方程為=10.2x+9.2,∴當x=10時,=10.2×10+9.2=111.2,故選C. 3.(2018·贛州一模)以下四
3、個命題: ①從勻速傳遞的產(chǎn)品生產(chǎn)流水線上,質檢員每20分鐘從中抽取一件產(chǎn)品進行某項指標檢測,這樣的抽樣是分層抽樣; ②兩個隨機變量相關性越強,則相關系數(shù)的絕對值越接近于1; ③在回歸直線方程=0.2x+12中,當解釋變量x每增加1個單位時,預報變量平均增加0.2個單位; ④分類變量X與Y,對它們的隨機變量K2的觀測值k來說,k越小,“X與Y有關系”的把握程度越大. 其中真命題為( ) A.①④ B.②④ C.①③ D.②③ 答案 D 解析?、贋橄到y(tǒng)抽樣;④分類變量X與Y,對它們的隨機變量K2的觀測值k來說,k越大,“X與Y有關系”的把握程度越大. 4.下面是一個2
4、×2列聯(lián)表 y1 y2 總計 x1 a 21 73 x2 22 25 47 合計 b 46 120 其中a,b處填的值分別為( ) A.94 72 B.52 50 C.52 74 D.74 52 答案 C 解析 由a+21=73,得a=52,a+22=b,得b=74.故選C. 5.(2018·湖南衡陽聯(lián)考)甲、乙、丙、丁四位同學各自對A,B兩個變量的線性相關性做試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m,如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 106 115
5、124 103 則哪位同學的試驗結果體現(xiàn)A,B兩變量有更強的線性相關性( ) A.甲 B.乙 C.丙 D.丁 答案 D 解析 r越大,m越小,線性相關性越強.故選D. 6.(2018·衡水中學調研)以下四個命題中,真命題是( ) A.對分類變量x與y的隨機變量K2的觀測值k來說,k越小,判斷“x與y有關系”的把握程度越大 B.兩個隨機變量的線性相關性越強,相關系數(shù)的絕對值越接近于0 C.若數(shù)據(jù)x1,x2,x3,…,xn的方差為1,則2x1,2x2,2x3,…,2xn的方差為2 D.在回歸分析中,可用相關指數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越
6、好 答案 D 解析 對于A,對分類變量x與y的隨機變量K2的觀測值k來說,k越大,判斷“x與y有關系”的把握程度越大,故A錯誤;對于B,兩個隨機變量的線性相關性越強,相關系數(shù)的絕對值越接近于1,故B錯誤;對于C,若數(shù)據(jù)x1,x2,x3,…,xn的方差為1,則2x1,2x2,2x3,…,2xn的方差為4,故C錯誤;對于D,根據(jù)離散變量的線性相關及相關指數(shù)的有關知識可知D正確. 7.2015年年度史詩大劇《羋月傳》風靡大江南北,影響力不亞于以前的《甄嬛傳》.某記者調查了大量《羋月傳》的觀眾,發(fā)現(xiàn)年齡段與愛看的比例存在較好的線性相關關系,年齡在[10,14],[15,19],[20,24],[
7、25,29][30,34]的愛看比例分別為10%,18%,20%,30%,t%.現(xiàn)用這5個年齡段的中間值代表年齡段,如12代表[10,14],17代表[15,19],根據(jù)前四個數(shù)據(jù)求得愛看比例y關于x的線性回歸方程為y=(kx-4.68)%,由此可推測t的值為( ) A.33 B.35 C.37 D.39 答案 B 解析 依題意,x=×(12+17+22+27)=19.5, y=×(10%+18%+20%+30%)=19.5%, 又∵回歸直線必過點(x,y),∴19.5%=(k×19.5-4.68)%,解得k=,∴當x=32時,(×32-4.68)%=35%,∴t≈35.
8、 8.(2018·廣西南寧月考)某同學寒假期間對其30位親屬的飲食習慣進行了一次調查,列出了如下列聯(lián)表: 偏愛蔬菜 偏愛肉類 合計 50歲以下 4 8 12 50歲以上 16 2 18 合計 20 10 30 則可以說其親屬的飲食習慣與年齡有關的把握為( ) 附:K2=. P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 A.90% B.95% C.99% D.99.9%
9、 答案 C 解析 由2×2列聯(lián)表知,K2==10.∵K2>6.635,K2<10.828,∴有99%的把握認為其親屬的飲食習慣與年齡有關. 9.2017世界特色魅力城市200強新鮮出爐,包括黃山市在內(nèi)的28個中國城市入選,美麗的黃山風景和人文景觀迎來眾多賓客.現(xiàn)在很多人喜歡“自助游”,某調查機構為了了解“自助游”是否與性別有關,在黃山旅游節(jié)期間,隨機抽取了100人,得如下所示的列聯(lián)表: 贊成“自助游” 不贊成“自助游” 合計 男性 30 15 45 女性 45 10 55 合計 75 25 100 參照公式,得到的正確結論是( ) A.有99.5%以
10、上的把握認為“贊成‘自助游’與性別無關” B.有99.5%以上的把握認為“贊成‘自助游’與性別有關” C.在犯錯誤的概率不超過0.1的前提下,認為“贊成‘自助游’與性別無關” D.在犯錯誤的概率不超過0.1的前提下,認為“贊成‘自助游’與性別有關” 參考公式:K2=,其中n=a+b+c+d. P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 答案 D 解析 將2×2列聯(lián)表中的數(shù)據(jù)代入計算,得K2=≈3.030,∵
11、2.706<3.030<3.841,∴在犯錯誤的概率不超過0.1的前提下,可以認為“贊成‘自助游’與性別有關”. 10.某研究機構對高三學生的記憶力x和判斷力y進行統(tǒng)計分析,所得數(shù)據(jù)如下表: x 6 8 10 12 y 2 3 5 6 則y對x的線性回歸直線方程為( ) A.=2.3x-0.7 B.=2.3x+0.7 C.=0.7x-2.3 D.=0.7x+2.3 (相關公式:=,=y(tǒng)-x) 答案 C 解析 ∵xiyi=6×2+8×3+10×5+12×6=158,x==9,y==4. ∴==0.7,=4-0.7×9=-2.3. 故線性回歸直線方程
12、為=0.7x-2.3. 11.在一次考試中,5名學生的數(shù)學和物理成績?nèi)缦卤恚?已知學生的數(shù)學和物理成績具有線性相關關系) 學生的編號i 1 2 3 4 5 數(shù)學成績x 80 75 70 65 60 物理成績y 70 66 68 64 62 現(xiàn)已知其線性回歸方程為 =0.36x+ ,則根據(jù)此線性回歸方程估計數(shù)學得90分的同學的物理成績?yōu)開_______(四舍五入到整數(shù)). 答案 73 解析 ==70,==66, 所以66=0.36×70+ ,解得 =40.8. 所以0.36×90+40.8=73.2≈73. 12.某工廠為了對一種新研發(fā)的產(chǎn)品進行
13、合理定價,將該產(chǎn)品按事先擬定的價格進行試銷,得到如下數(shù)據(jù): 單價x(元) 4 5 6 7 8 9 銷量y(件) 90 84 83 80 75 68 由表中數(shù)據(jù),求得線性回歸方程為=-4x+.若在這些樣本點中任取一點,則它在回歸直線左下方的概率為________. 答案 解析 由表中數(shù)據(jù)得x=6.5,y=80,由y=-4x+,得=106,故線性回歸方程為=-4x+106.將(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分別代入回歸方程,可知有6個基本事件,因84<-4×5+106=86,68<-4×9+106=70,故(5,
14、84)和(9,68)在直線的左下方,滿足條件的只有2個,故所求概率為=. 13.已知某學校的特長班有50名學生,其中有體育生20名,藝術生30名,在學校組織的一次體檢中,該班所有學生進行了心率測試,心率全部介于50次/分到75次/分之間,現(xiàn)將數(shù)據(jù)分成五組,第一組[50,55),第二組[55,60),…,第五組[70,75],按上述分組方法得到的頻率分布直方圖如圖所示.因為學習專業(yè)的原因,體育生常年進行系統(tǒng)的身體鍛煉,藝術生則很少進行系統(tǒng)的身體鍛煉,若前兩組的學生中體育生有8名. (1)根據(jù)頻率分布直方圖及題設數(shù)據(jù)完成下列2×2列聯(lián)表. 心率小于60次/分 心率不小于60次/分
15、 合計 體育生 20 藝術生 30 合計 50 (2)根據(jù)(1)中表格數(shù)據(jù)計算可知,________(填“有”或“沒有”99.5%的把握認為“心率小于60次/分與常年進行系統(tǒng)的身體鍛煉有關”. 附:K2=,其中n=a+b+c+d. P(K2≥k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 答案 (1)見解析 (2)有關 解析 (1)根據(jù)頻率分布直方圖可知,前兩組的學生總數(shù)為(0.032+0.
16、08)×5×50=10,又前兩組的學生中體育生有8名,所以前兩組的學生中藝術生有2名,故2×2列聯(lián)表如下: 心率小于60次/分 心率不小于60次/分 合計 體育生 8 12 20 藝術生 2 28 30 合計 10 40 50 (2)由(1)中數(shù)據(jù)知,K2=≈8.333>7.879,故有99.5%的把握認為“心率小于60次/分與常年進行系統(tǒng)的身體鍛煉有關”. 14.(2018·山東日照一模)某學校高三年級有學生500人,其中男生300人,女生200人.為了研究學生的數(shù)學成績是否與性別有關,現(xiàn)采用分層抽樣的方法,從中抽取了100名學生,先統(tǒng)計了他們期中考試的
17、數(shù)學分數(shù),然后按性別分為男、女兩組,再將兩組學生的分數(shù)分成5組:[100,110),[110,120),[120,130),[130,140),[140,150]分別加以統(tǒng)計,得到如圖所示的頻率分布直方圖. (1)從樣本中分數(shù)低于110分的學生中隨機抽取兩人,求這兩人恰好為一男一女的概率; (2)若規(guī)定分數(shù)不低于130分的學生為“數(shù)學尖子生”,請你根據(jù)已知條件完成2×2列聯(lián)表,并判斷是否有90%的把握認為“數(shù)學尖子生與性別有關”. 附:K2= P(K2≥k0) 0.10 0.05 0.010 0.005 0.001 k0 2.706 3.841 6.635 7.
18、879 10.828 答案 (1) (2)有關 解析 (1)由已知得,抽取的100名學生中,男生60名,女生40名. 分數(shù)低于110分的學生中,男生有60×0.05=3(人),記為A1,A2,A3;女生有40×0.05=2(人),記為B1,B2. 從中隨機抽取兩名學生,所有的可能結果共有10種,它們是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2)(B1,B2); 其中兩名學生恰好為一男一女的可能結果共有6種,它們是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B
19、1),(A3,B2). ∴所求概率為P==. (2)由頻率分布直方圖可知,在抽取的100名學生中,分數(shù)不低于130分的男生人數(shù)為60×0.25=15,分數(shù)不低于130分的女生人數(shù)為40×0.4=16,據(jù)此可得2×2列聯(lián)表如下: 數(shù)學尖子生 非數(shù)學尖子生 合計 男生 15 45 60 女生 16 24 40 合計 31 69 100 ∴K2=≈2.525<2.706, ∴沒有90%的把握認為“數(shù)學尖子生與性別有關”. 15.(2017·四川廣元二診)某農(nóng)科所對冬季晝夜溫差大小與某反季節(jié)大豆新品種發(fā)芽多少之間的關系進行分析研究,他們分別記錄了12月1日至
20、12月5日的每天晝夜溫差與實驗室每天每100顆種子中的發(fā)芽數(shù),得到如下資料: 日期 12月1日 12月2日 12月3日 12月4日 12月5日 溫差x(℃) 10 11 13 12 8 發(fā)芽數(shù)y(顆) 23 25 30 26 16 該農(nóng)科所確定的研究方案是:先從這5組數(shù)據(jù)中選取2組,用剩下的3組數(shù)據(jù)求線性回歸方程,再對被選取的2組數(shù)據(jù)進行檢驗. (1)求選取的2組數(shù)據(jù)恰好是不相鄰兩天數(shù)據(jù)的概率; (2)若選取的是12月1日與12月5日的數(shù)據(jù),請根據(jù)12月2日至12月4日的數(shù)據(jù),求出y關于x的線性回歸方程=x+; (3)若由線性回歸方程得到的估計數(shù)據(jù)與
21、所選出的檢驗數(shù)據(jù)的誤差均不超過2顆.則認為得到的線性回歸方程是可靠的.試問(2)中所得到的線性回歸方程是可靠的嗎? 附:回歸直線的斜率和截距的最小二乘估計公式分別為: 答案 (1) (2) =x-3 (3)可靠 解析 (1)設“選取的2組數(shù)據(jù)恰好是不相鄰兩天的數(shù)據(jù)”為事件A. 從5組數(shù)據(jù)中選取2組數(shù)據(jù)共有10種情況:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5),其中數(shù)據(jù)為12月份的日期數(shù). 每種情況都是等可能出現(xiàn)的,事件A包括的基本事件有6種. ∴P(A)==. ∴選取的2組數(shù)據(jù)恰好是不相鄰兩天數(shù)據(jù)的概率是
22、. (2)由數(shù)據(jù)可得==12,==27. ∴==, =- =27-×12=-3. ∴y關于x的線性回歸方程為=x-3. (3)當x=10時,=×10-3=22,|22-23|<2; 同理,當x=8時,=×8-3=17,|17-16|<2. ∴(2)中所得到的線性回歸方程是可靠的. 16.(2018·河北唐山模擬)某市春節(jié)期間7家超市的廣告費支出xi(萬元)和銷售額yi(萬元)數(shù)據(jù)如下: 超市 A B C D E F G 廣告費支出xi 1 2 4 6 11 13 19 銷售額yi 19 32 40 44 52 53 54 (1)
23、若用線性回歸模型擬合y與x的關系,求y關于x的線性回歸方程; (2)用二次函數(shù)回歸模型擬合y與x的關系,可得回歸方程:y∧=-0.17x2+5x+20,經(jīng)計算二次函數(shù)回歸模型和線性回歸模型的R2分別約為0.92和0.75,請用R2說明選擇哪個回歸模型更合適,并用此模型預測A超市廣告費支出3萬元時的銷售額. 參考數(shù)據(jù)及公式:x=8,y=42,xiyi=2 794,xi2=708,=,=y(tǒng)-x. 答案 (1) =1.7x+28.4 (2)33.47 解析 (1) ===1.7,=y(tǒng)-x=42-1.7×8=28.4. ∴y關于x的線性回歸方程是=1.7x+28.4. (2)∵0.75<0
24、.92,∴二次函數(shù)回歸模型更合適. 當x=3萬元時,=-0.17×9+5×3+20=33.47,預測A超市銷售額為33.47萬元. 1.設兩個變量x和y之間具有線性相關關系,它們的相關系數(shù)是r,y關于x的回歸直線的斜率是b,縱截距是a,那么必有( ) A.b與r的符號相同 B.a(chǎn)與r的符號相同 C.b與r的符號相反 D.a(chǎn)與r的符號相反 答案 A 2.下列說法: ①將一組數(shù)據(jù)中的每個數(shù)據(jù)都加上或減去同一個常數(shù)后,方差恒不變; ②設有一個回歸方程=3-5x,變量x增加一個單位時,y平均增加5個單位; ③回歸直線=x+必過點(,); ④在一個2×2列聯(lián)表中,由計算
25、得K2的觀測值k=13.079,則在犯錯誤的概率不超過0.001的前提下認為這兩個變量間有關系.其中錯誤的個數(shù)是( ) A.0 B.1 C.2 D.3 本題可以參考獨立性檢驗臨界值表: P(K2≥k) 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 答案 B 解析 只有②錯誤,應該是y平均減少5個單位. 3.(2018·湖南衡陽模擬)根據(jù)“2015
26、年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報”中公布的數(shù)據(jù),從2011年到2015年,我國的第三產(chǎn)業(yè)在GDP中的比重如下: 年份 2011 2012 2013 2014 2015 年份代碼x 1 2 3 4 5 第三產(chǎn)業(yè)比重y/% 44.3 45.5 46.9 48.1 50.5 (1)在所給坐標系中作出數(shù)據(jù)對應的散點圖; (2)建立第三產(chǎn)業(yè)在GDP中的比重y關于年份代碼x的回歸方程; (3)按照當前的變化趨勢,預測2018年我國第三產(chǎn)業(yè)在GDP中的比重. 附:回歸直線=+x的斜率和截距的最小二乘估計分別為=,=y(tǒng)-x. 答案 (1)見解析 (2) =1.5x
27、+42.56 (3)54.56% 解析 (1)數(shù)據(jù)對應的散點圖如圖所示. (2)x=3,y=47.06,===1.5,=y(tǒng)-x=42.56, 所以回歸直線方程為=1.5x+42.56. (3)代入2018年的年份代碼x=8,得=1.5×8+42.56=54.56, 所以按照當時的變化趨勢,預計到2018年,我國第三產(chǎn)業(yè)在GDP中的比重將達到54.56%. 4.假設關于某種設備的使用年限x(年)與所支出的維修費用y(萬元)有如以下的統(tǒng)計數(shù)據(jù); x(年) 2 3 4 5 6 y(萬元) 2.2 3.8 5.5 6.5 7.0 (1)求,; (2)對x
28、,y進行線性相關性檢驗; (3)如果x與y具有線性相關關系,求出回歸直線方程; (4)估計使用年限為10年時,維修費用約是多少? 答案 (1)=4,=5 (2)略 (3) =1.23x+0.08 (4)12.38萬元 解析 (1)==4,==5. 所以r==≈0.987. 因為0.987>0.75,所以x與y之間具有很強的線性相關關系. (4)當x=10時,=1.23×10+0.08=12.38,即估計使用年限為10年時,維修費用約為12.38萬元. 5.(2018·廣東韶關期末)某商店為了更好地規(guī)劃某種商品的進貨量,從某一年的銷售數(shù)據(jù)中,隨機抽取了8組數(shù)據(jù)作為研究對象
29、,如下表所示(x為該商品的進貨量,y為銷售天數(shù)). x/噸 2 3 4 5 6 8 9 11 y/天 1 2 3 3 4 5 6 8 (1)根據(jù)上表數(shù)據(jù)在下圖所示的網(wǎng)格中繪制散點圖; (2)根據(jù)上表提供的數(shù)據(jù),求出y關于x的線性回歸方程=x+; (3)根據(jù)(2)中的計算結果,若該商店準備一次性進貨24噸,預測需要銷售的天數(shù). 參考公式和數(shù)據(jù):=,=y(tǒng)-x; xi2=356,xiyi=241. 答案 (1)略 (2) =x- (3)17天 解析 (1)散點圖如圖所示: (2)依題意,得x=×(2+3+4+5+6+8+9+11)=6, y=×(1+2+3+3+4+5+6+8)=4, 又xi2=356,xiyi=241, 所以===,=4-×6=-, 故線性回歸方程為=x-. (3)由(2)知,當x=24時,=×24-≈17, 故若該商店一次性進貨24噸,則預計需要銷售17天.
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。