金版教程高考數(shù)學(xué) 文二輪復(fù)習(xí)講義:第二編 專題整合突破 專題七概率與統(tǒng)計(jì) 第二講 統(tǒng)計(jì)與統(tǒng)計(jì)案例 Word版含解析
第二講統(tǒng)計(jì)與統(tǒng)計(jì)案例必記公式數(shù)據(jù)x1,x2,x3,xn的數(shù)字特征(1)眾數(shù):在樣本數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個(gè)數(shù)據(jù)中位數(shù):樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù)如果數(shù)據(jù)的個(gè)數(shù)為偶數(shù),就取中間兩個(gè)數(shù)據(jù)的平均數(shù)作為中位數(shù);(2)樣本平均數(shù)(x1x2xn)xi;(3)樣本方差s2(x1)2(x2)2(xn)2 (xi)2;(4)樣本標(biāo)準(zhǔn)差s.重要結(jié)論1直方圖的三個(gè)有用結(jié)論(1)小長(zhǎng)方形的面積組距×頻率;(2)各小長(zhǎng)方形的面積之和等于1;(3)小長(zhǎng)方形的高,所有小長(zhǎng)方形高的和為.2回歸直線方程一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)其回歸方程x,其過(guò)樣本點(diǎn)中心(,)3獨(dú)立性檢驗(yàn)K2(其中nabcd為樣本容量).失分警示1混淆簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣,不能正確地選擇抽樣方法2不能正確地從頻率分布直方圖中提取相關(guān)的信息,忽略了頻數(shù)與頻率的差異3混淆條形圖與直方圖,條形圖是離散隨機(jī)變量,縱坐標(biāo)刻度為頻數(shù)或頻率,直方圖是連續(xù)隨機(jī)變量,縱坐標(biāo)刻度為頻率/組距,這是密度,連續(xù)隨機(jī)變量在某一點(diǎn)上是沒(méi)有頻率的4回歸分析是對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法只有在散點(diǎn)圖大致呈線性時(shí),求出的回歸直線方程才有實(shí)際意義考點(diǎn)抽樣方法典例示法典例1(1)為了解某地區(qū)的中小學(xué)生的視力情況,擬從該地區(qū)的中小學(xué)生中抽取部分學(xué)生進(jìn)行調(diào)查,事先已了解到該地區(qū)小學(xué)、初中、高中三個(gè)學(xué)段學(xué)生的視力情況有較大差異,而男女生視力情況差異不大在下面的抽樣方法中,最合理的抽樣方法是()A簡(jiǎn)單隨機(jī)抽樣 B按性別分層抽樣C按學(xué)段分層抽樣 D系統(tǒng)抽樣解析因?yàn)槟信暳η闆r差異不大,而學(xué)段的視力情況有較大差異,所以應(yīng)按學(xué)段分層抽樣答案C(2)20xx·廣東高考已知某地區(qū)中小學(xué)生人數(shù)和近視情況分別如圖1和圖2所示為了解該地區(qū)中小學(xué)生的近視形成原因,用分層抽樣的方法抽取2%的學(xué)生進(jìn)行調(diào)查,則樣本容量和抽取的高中生近視人數(shù)分別為()A200,20 B100,20C200,10 D100,10解析由題圖可知,樣本容量等于(350045002000)×2%200;抽取的高中生近視人數(shù)為2000×2%×50%20,故選A.答案A系統(tǒng)抽樣與分層抽樣的求解方法(1)系統(tǒng)抽樣的最基本特征是“等距性”,每組內(nèi)所抽取的號(hào)碼需要依據(jù)第一組抽取的號(hào)碼和組距唯一確定每組抽取樣本的號(hào)碼依次構(gòu)成一個(gè)以第一組抽取的號(hào)碼m為首項(xiàng),組距d為公差的等差數(shù)列an,第k組抽取樣本的號(hào)碼akm(k1)d.(2)分層抽樣的關(guān)鍵是根據(jù)樣本特征的差異進(jìn)行分層,實(shí)質(zhì)是等比例抽樣,求解此類問(wèn)題需先求出抽樣比樣本容量與總體容量的比,則各層所抽取的樣本容量等于該層個(gè)體總數(shù)與抽樣比的乘積在每層抽樣時(shí),應(yīng)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣進(jìn)行針對(duì)訓(xùn)練1.20xx·浙江杭州模擬某校150名教職工中,有老年人20名,中年人50名,青年人80名,從中抽取30名作為樣本采用隨機(jī)抽樣法:抽簽取出30個(gè)樣本;采用系統(tǒng)抽樣法:將教職工編號(hào)為00,01,149,然后平均分組抽取30個(gè)樣本;采用分層抽樣法:從老年人、中年人、青年人中抽取30個(gè)樣本下列說(shuō)法中正確的是 ()A無(wú)論采用哪種方法,這150名教職工中每個(gè)人被抽到的概率都相等B兩種抽樣方法,這150名教職工中每個(gè)人被抽到的概率都相等;并非如此C兩種抽樣方法,這150名教職工中每個(gè)人被抽到的概率都相等;并非如此D采用不同的抽樣方法,這150名教職工中每個(gè)人被抽到的概率是各不相同的答案A解析三種抽樣方法中,每個(gè)人被抽到的概率都等于,故選A.220xx·江西南昌一模一所中學(xué)共有4000名學(xué)生,為了引導(dǎo)學(xué)生樹(shù)立正確的消費(fèi)觀,需抽樣調(diào)查學(xué)生每天使用零花錢(qián)的數(shù)量(取整數(shù)元)情況,分層抽取容量為300的樣本,作出頻率分布直方圖如圖所示,請(qǐng)估計(jì)在全校所有學(xué)生中,一天使用零花錢(qián)在6元14元的學(xué)生大約有_人答案2720解析根據(jù)頻率分布直方圖得:一天使用零花錢(qián)在6元14元的學(xué)生頻率是1(0.020.030.03)×410.320.68,對(duì)應(yīng)的頻數(shù)是4000×0.682720,估計(jì)全校學(xué)生中,一天使用零花錢(qián)在6元14元的大約有2720人考點(diǎn)用樣本估計(jì)總體典例示法題型1用樣本數(shù)字特征估計(jì)總體典例220xx·湖南高考某企業(yè)有甲、乙兩個(gè)研發(fā)小組,為了比較他們的研發(fā)水平,現(xiàn)隨機(jī)抽取這兩個(gè)小組往年研發(fā)新產(chǎn)品的結(jié)果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b),其中a,分別表示甲組研發(fā)成功和失?。籦,分別表示乙組研發(fā)成功和失敗(1)若某組成功研發(fā)一種新產(chǎn)品,則給該組記1分,否則記0分試計(jì)算甲、乙兩組研發(fā)新產(chǎn)品的成績(jī)的平均數(shù)和方差,并比較甲、乙兩組的研發(fā)水平;(2)若該企業(yè)安排甲、乙兩組各自研發(fā)一種新產(chǎn)品,試估計(jì)恰有一組研發(fā)成功的概率解(1)甲組研發(fā)新產(chǎn)品的成績(jī)?yōu)?,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均數(shù)為甲;方差為s.乙組研發(fā)新產(chǎn)品的成績(jī)?yōu)?,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均數(shù)為乙;方差為s.因?yàn)榧?gt;乙,s<s,所以甲組的研發(fā)水平優(yōu)于乙組(2)記E恰有一組研發(fā)成功在所抽得的15個(gè)結(jié)果中,恰有一組研發(fā)成功的結(jié)果是(a,),(,b),(a,),(,b),(a,),(a,),(,b),共7個(gè),故事件E發(fā)生的頻率為.將頻率視為概率,即得所求概率為P(E).題型2用頻率分布直方圖估計(jì)總體典例320xx·廣東高考某城市100戶居民的月平均用電量(單位:度),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分組的頻率分布直方圖如圖(1)求直方圖中x的值;(2)求月平均用電量的眾數(shù)和中位數(shù);(3)在月平均用電量為220,240),240,260),260,280),280,300的四組用戶中,用分層抽樣的方法抽取11戶居民,則月平均用電量在220,240)的用戶中應(yīng)抽取多少戶?解(1)由已知得,20×(0.0020.00950.0110.0125x0.0050.0025)1,解得x0.0075.(2)由題圖可知,面積最大的矩形對(duì)應(yīng)的月平均用電量區(qū)間為220,240),所以月平均用電量的眾數(shù)的估計(jì)值為230;因?yàn)?0×(0.0020.00950.011)0.45<0.5,20×(0.0020.009 50.0110.0125)0.7>0.5,所以中位數(shù)在區(qū)間220,240)內(nèi),設(shè)中位數(shù)為m,則20×(0.0020.00950.011)0.0125×(m220)0.5,解得m224.所以月平均用電量的中位數(shù)為224.(3)由題圖知,月平均用電量為220,240)的用戶數(shù)為(240220)×0.0125×10025,同理可得,月平均用電量為240,260),260,280),280,300的用戶數(shù)分別為15,10,5.故用分層抽樣的方式抽取11戶居民,月平均用電量在220,240)的用戶中應(yīng)抽取11×5(戶)1用樣本估計(jì)總體的兩種方法(1)用樣本的頻率分布(頻率分布表、頻率分布直方圖、莖葉圖等)估計(jì)總體的頻率分布. (2)用樣本的數(shù)字特征(眾數(shù)、中位數(shù)、平均數(shù)、方差、標(biāo)準(zhǔn)差)估計(jì)總體的數(shù)字特征2方差的計(jì)算與含義計(jì)算方差首先要計(jì)算平均數(shù),然后再按照方差的計(jì)算公式進(jìn)行計(jì)算,方差和標(biāo)準(zhǔn)差是描述一個(gè)樣本和總體的波動(dòng)大小的特征數(shù),方差、標(biāo)準(zhǔn)差大說(shuō)明波動(dòng)大3眾數(shù)、中位數(shù)、平均數(shù)與頻率分布直方圖的關(guān)系(1)眾數(shù)為頻率分布直方圖中最高矩形的底邊中點(diǎn)的橫坐標(biāo)(2)中位數(shù)為平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點(diǎn)的橫坐標(biāo)(3)平均數(shù)等于頻率分布直方圖中每個(gè)小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和考點(diǎn)線性回歸分析與獨(dú)立性檢驗(yàn)典例示法題型1線性回歸分析典例420xx·全國(guó)卷下圖是我國(guó)至生活垃圾無(wú)害化處理量(單位:億噸)的折線圖(1)由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請(qǐng)用相關(guān)系數(shù)加以說(shuō)明;(2)建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測(cè)我國(guó)生活垃圾無(wú)害化處理量附注:參考數(shù)據(jù):yi9.32,tiyi40.17, 0.55,2.646.參考公式:相關(guān)系數(shù)r,回歸方程t中斜率和截距的最小二乘估計(jì)公式分別為:, .解(1)由折線圖中數(shù)據(jù)和附注中參考數(shù)據(jù)得4, (ti)228, 0.55, (ti)(yi)tiyiyi40.174×9.322.89,r0.99.因?yàn)閥與t的相關(guān)系數(shù)近似為0.99,說(shuō)明y與t的線性相關(guān)程度相當(dāng)高,從而可以用線性回歸模型擬合y與t的關(guān)系(2)由1.331及(1)得0.103,1.3310.103×40.92.所以,y關(guān)于t的回歸方程為0.920.10t.將對(duì)應(yīng)的t9代入回歸方程得0.920.10×91.82.所以預(yù)測(cè)我國(guó)生活垃圾無(wú)害化處理量約為1.82億噸題型2獨(dú)立性檢驗(yàn)典例520xx·長(zhǎng)春質(zhì)檢近年來(lái)我國(guó)電子商務(wù)行業(yè)迎來(lái)蓬勃發(fā)展的新機(jī)遇,雙11期間,某平臺(tái)的銷售業(yè)績(jī)高達(dá)918億人民幣與此同時(shí),相關(guān)管理部門(mén)也推出了針對(duì)電商的商品和服務(wù)評(píng)價(jià)體系現(xiàn)從評(píng)價(jià)系統(tǒng)中隨機(jī)選出200次成功的交易,并對(duì)其評(píng)價(jià)結(jié)果進(jìn)行統(tǒng)計(jì),對(duì)商品的好評(píng)率為,對(duì)服務(wù)的好評(píng)率為,其中對(duì)商品和服務(wù)都做出好評(píng)的交易為80次(1)是否可以在犯錯(cuò)誤概率不超過(guò)0.1%的前提下,認(rèn)為商品好評(píng)與服務(wù)好評(píng)有關(guān)?(2)若針對(duì)商品的好評(píng)率,采用分層抽樣的方式從這200次交易中取出5次交易,并從中選擇2次交易進(jìn)行客戶回訪,求只有一次好評(píng)的概率P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解(1)由題意可得關(guān)于商品和服務(wù)評(píng)價(jià)的2×2列聯(lián)表:對(duì)服務(wù)好評(píng)對(duì)服務(wù)不滿意合計(jì)對(duì)商品好評(píng)8040120對(duì)商品不滿意701080合計(jì)15050200K211.111>10.828,可以在犯錯(cuò)誤概率不超過(guò)0.1%的前提下,認(rèn)為商品好評(píng)與服務(wù)好評(píng)有關(guān)(2)若針對(duì)商品的好評(píng)率,采用分層抽樣的方式從這200次交易中取出5次交易,則好評(píng)的交易次數(shù)為3,不滿意的次數(shù)為2,令好評(píng)的交易為A,B,C,不滿意的交易為a,b,從5次交易中,取出2次的所有取法為(A,B)、(A,C)、(A,a)、(A、b)、(B,C)、(B,a)、(B,b)、(C,a)、(C,b)、(a,b),共計(jì)10種情況,其中只有一次好評(píng)的情況是(A,a)、(A,b)、(B,a)、(B,b)、(C,a)、(C,b),共計(jì)6種,因此,只有一次好評(píng)的概率為.1進(jìn)行線性回歸分析時(shí)應(yīng)注意的問(wèn)題(1)正確理解計(jì)算、的公式和準(zhǔn)確的計(jì)算,是求線性回歸方程的關(guān)鍵(2)在分析兩個(gè)變量的相關(guān)關(guān)系時(shí),可根據(jù)樣本數(shù)據(jù)作出散點(diǎn)圖來(lái)確定兩個(gè)變量之間是否具有相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,則可通過(guò)線性回歸方程估計(jì)和預(yù)測(cè)變量的值2進(jìn)行獨(dú)立性檢驗(yàn)的步驟(1)假設(shè)兩個(gè)分類變量X與Y無(wú)關(guān);(2)找相關(guān)數(shù)據(jù),列出2×2列聯(lián)表;(3)由公式K2(其中nabcd)計(jì)算出K2的值;(4)將K2的值與臨界值進(jìn)行對(duì)比,進(jìn)而做出統(tǒng)計(jì)推斷提醒:K2的觀測(cè)值越大,對(duì)應(yīng)假設(shè)事件成立的概率越小,假設(shè)事件不成立的概率越大全國(guó)卷高考真題調(diào)研120xx·全國(guó)卷根據(jù)下面給出的2004年至我國(guó)二氧化硫年排放量(單位:萬(wàn)噸)柱形圖,以下結(jié)論中不正確的是()A逐年比較,減少二氧化硫排放量的效果最顯著B(niǎo)我國(guó)治理二氧化硫排放顯現(xiàn)成效C以來(lái)我國(guó)二氧化硫年排放量呈減少趨勢(shì)D以來(lái)我國(guó)二氧化硫年排放量與年份正相關(guān)答案D解析根據(jù)柱形圖可觀察兩個(gè)變量的相關(guān)性,易知A、B、C正確,以來(lái)我國(guó)二氧化硫年排放量與年份負(fù)相關(guān),選項(xiàng)D錯(cuò)誤故選D.220xx·全國(guó)卷某公司為確定下一年度投入某種產(chǎn)品的宣傳費(fèi),需了解年宣傳費(fèi)x(單位:千元)對(duì)年銷售量y(單位:t)和年利潤(rùn)z(單位:千元)的影響對(duì)近8年的年宣傳費(fèi)xi和年銷售量yi(i1,2,8)數(shù)據(jù)作了初步處理,得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值 (xi)2 (wi)2 (xi)(yi) (wi)(yi)46.65636.8289.81.61469108.8表中wi,wi.(1)根據(jù)散點(diǎn)圖判斷,yabx與ycd哪一個(gè)適宜作為年銷售量y關(guān)于年宣傳費(fèi)x的回歸方程類型?(給出判斷即可,不必說(shuō)明理由)(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(3)已知這種產(chǎn)品的年利潤(rùn)z與x,y的關(guān)系為z0.2yx.根據(jù)(2)的結(jié)果回答下列問(wèn)題:年宣傳費(fèi)x49時(shí),年銷售量及年利潤(rùn)的預(yù)報(bào)值是多少?年宣傳費(fèi)x為何值時(shí),年利潤(rùn)的預(yù)報(bào)值最大?附:對(duì)于一組數(shù)據(jù)(u1,v1),(u2,v2),(un,vn),其回歸直線vu的斜率和截距的最小二乘估計(jì)分別為,解(1)由散點(diǎn)圖可以判斷,ycd適宜作為年銷售量y關(guān)于年宣傳費(fèi)x的回歸方程類型(2)令w,先建立y關(guān)于w的線性回歸方程由于68,56368×6.8100.6,所以y關(guān)于w的線性回歸方程為100.668w,因此y關(guān)于x的回歸方程為100.668.(3)由(2)知,當(dāng)x49時(shí),年銷售量y的預(yù)報(bào)值100.668576.6,年利潤(rùn)z的預(yù)報(bào)值576.6×0.24966.32.根據(jù)(2)的結(jié)果知,年利潤(rùn)z的預(yù)報(bào)值0.2(100.668)xx13.620.12.所以當(dāng)6.8,即x46.24時(shí),取得最大值故年宣傳費(fèi)為46.24千元時(shí),年利潤(rùn)的預(yù)報(bào)值最大其它省市高考題借鑒320xx·山東高考某高校調(diào)查了200名學(xué)生每周的自習(xí)時(shí)間(單位:小時(shí)),制成了如圖所示的頻率分布直方圖,其中自習(xí)時(shí)間的范圍是17.5,30,樣本數(shù)據(jù)分組為17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根據(jù)直方圖,這200名學(xué)生中每周的自習(xí)時(shí)間不少于22.5小時(shí)的人數(shù)是()A56 B60C120 D140答案D解析由頻率分布直方圖可知,這200名學(xué)生每周的自習(xí)時(shí)間不少于22.5小時(shí)的頻率為(0.160.080.04)×2.50.7,故這200名學(xué)生中每周的自習(xí)時(shí)間不少于22.5小時(shí)的人數(shù)為200×0.7140.故選D.420xx·湖南高考在一次馬拉松比賽中,35名運(yùn)動(dòng)員的成績(jī)(單位:分鐘)的莖葉圖如圖所示.若將運(yùn)動(dòng)員按成績(jī)由好到差編為135號(hào),再用系統(tǒng)抽樣方法從中抽取7人,則其中成績(jī)?cè)趨^(qū)間139,151上的運(yùn)動(dòng)員人數(shù)是_答案4解析35人抽取7人,則n5,而在139,151上共有20人,應(yīng)抽取4人520xx·安徽高考某高校共有學(xué)生15000人,其中男生10500人,女生4500人為調(diào)查該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的情況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的樣本數(shù)據(jù)(單位:小時(shí))(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個(gè)樣本數(shù)據(jù),得到學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:0,2,(2,4,(4,6,(6,8,(8,10,(10,12估計(jì)該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)的概率;(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí),請(qǐng)完成每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表,并判斷是否有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”附:K2P(K2k0)0.100.050.0100.005k02.7063.8416.6357.879解(1)300×90,所以應(yīng)收集90位女生的樣本數(shù)據(jù)(2)由頻率分布直方圖得12×(0.1000.025)0.75,所以該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)的概率的估計(jì)值為0.75.(3)由(2)知,300位學(xué)生中有300×0.75225人的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí),75人的每周平均體育運(yùn)動(dòng)時(shí)間不超過(guò)4小時(shí)又因?yàn)闃颖緮?shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的,所以每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表如下: 每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表男生女生總計(jì)每周平均體育運(yùn)動(dòng)時(shí)間不超過(guò)4小時(shí)453075每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)16560225總計(jì)21090300結(jié)合列聯(lián)表可算得K24.762>3.841.所以,有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”一、選擇題120xx·蘭州雙基測(cè)試某鄉(xiāng)政府調(diào)查A、B、C、D四個(gè)村的村民外出打工的情況,擬采用分層抽樣的方法從四個(gè)村中抽取一個(gè)容量為500的樣本進(jìn)行調(diào)查已知A、B、C、D四個(gè)村的人數(shù)之比為4556,則應(yīng)從C村中抽取的村民人數(shù)為()A100 B125C150 D175答案B解析由題意可知,應(yīng)從C村中抽取500×125名村民220xx·湖北武漢第二次調(diào)研如圖是依據(jù)某城市年齡在20歲到45歲的居民上網(wǎng)情況調(diào)查而繪制的頻率分布直方圖,現(xiàn)已知年齡在30,35),35,40),40,45)的上網(wǎng)人數(shù)呈現(xiàn)遞減的等差數(shù)列分布,則年齡在35,40)的網(wǎng)民出現(xiàn)的頻率為()A0.04 B0.06C0.2 D0.3答案C解析由頻率分布直方圖的知識(shí)得,年齡在20,25)的頻率為0.01×50.05,25,30)的頻率為0.07×50.35,設(shè)年齡在30,35),35,40),40,45的頻率為x,y,z,又x,y,z成等差數(shù)列,所以可得解得y0.2,所以年齡在35,40)的網(wǎng)民出現(xiàn)的頻率為0.2.故選C.320xx·開(kāi)封一模下列說(shuō)法錯(cuò)誤的是()A自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系B在線性回歸分析中,相關(guān)系數(shù)r的值越大,變量間的相關(guān)性越強(qiáng)C在殘差圖中,殘差點(diǎn)分布的帶狀區(qū)域的寬度越狹窄,其模型擬合的精度越高D在回歸分析中,R2為0.98的模型比R2為0.80的模型擬合的效果好答案B解析根據(jù)相關(guān)關(guān)系的概念知A正確;當(dāng)r>0時(shí),r越大,相關(guān)性越強(qiáng),當(dāng)r<0時(shí),r越大,相關(guān)性越弱,故B不正確;對(duì)于一組數(shù)據(jù)的擬合程度的好壞的評(píng)價(jià),一是殘差點(diǎn)分布的帶狀區(qū)域越窄,擬合效果越好二是R2越大,擬合效果越好,所以R2為0.98的模型比R2為0.80的模型擬合的效果好,C,D正確,故選B.420xx·河南鄭州二模某工廠為了對(duì)新研發(fā)的一種產(chǎn)品進(jìn)行合理定價(jià),將該產(chǎn)品按事先擬定的價(jià)格進(jìn)行試銷,得到如下數(shù)據(jù):?jiǎn)蝺r(jià)(元)456789銷量(件)908483807568由表中數(shù)據(jù),求得線性回歸方程4xa,若在這些樣本點(diǎn)中任取一點(diǎn),則它在回歸直線左下方的概率為()A. B.C. D.答案B解析由表中數(shù)據(jù)得6.5,80.由(,)在直線4xa上,得a106.即線性回歸方程為4x106.經(jīng)過(guò)計(jì)算只有(5,84)和(9,68)在直線的下方,故所求概率為,選B.520xx·湖南永州一模為大力提倡“厲行節(jié)約,反對(duì)浪費(fèi)”,某市通過(guò)隨機(jī)詢問(wèn)100名性別不同的居民是否能做到“光盤(pán)”行動(dòng),得到如下的列聯(lián)表:做不到“光盤(pán)”能做到“光盤(pán)”男4510女3015附:P(K2k)0.100.050.025k2.7063.8415.024K2.參照附表,得到的正確結(jié)論是()A在犯錯(cuò)誤的概率不超過(guò)1%的前提下,認(rèn)為“該市居民能否做到光盤(pán)與性別有關(guān)”B在犯錯(cuò)誤的概率不超過(guò)1%的前提下,認(rèn)為“該市居民能否做到光盤(pán)與性別無(wú)關(guān)”C有90%以上的把握認(rèn)為“該市居民能否做到光盤(pán)與性別有關(guān)”D有90%以上的把握認(rèn)為“該市居民能否做到光盤(pán)與性別無(wú)關(guān)”答案C解析由題設(shè)知,a45,b10,c30,d15,所以K23.0303.2706<3.0303<3.841.由附表可知,有90%以上的把握認(rèn)為“該市居民能否做到光盤(pán)與性別有關(guān)”,故選C.二、填空題620xx·石家莊質(zhì)檢二將高三(1)班參加體檢的36名學(xué)生,編號(hào)為:1,2,3,36,若采用系統(tǒng)抽樣的方法抽取一個(gè)容量為4的樣本,已知樣本中含有編號(hào)為6、24、33的學(xué)生,則樣本中剩余一名學(xué)生的編號(hào)是_答案15解析根據(jù)系統(tǒng)抽樣的特點(diǎn)可知抽取的4名學(xué)生的編號(hào)依次成等差數(shù)列,故剩余一名學(xué)生的編號(hào)是15.720xx·豫北十校聯(lián)考的NBA全明星賽于北京時(shí)間2月14日舉行如圖是參加此次比賽的甲、乙兩名籃球運(yùn)動(dòng)員以往幾場(chǎng)比賽得分的莖葉圖,則甲、乙兩人這幾場(chǎng)比賽得分的中位數(shù)之和是_答案64解析應(yīng)用莖葉圖的知識(shí)得,甲、乙兩人這幾場(chǎng)比賽得分的中位數(shù)分別為28,36,因此甲、乙兩人這幾場(chǎng)比賽得分的中位數(shù)之和是64.820xx·吉林通化月考某產(chǎn)品的廣告費(fèi)用x(萬(wàn)元)與銷售額y(萬(wàn)元)的統(tǒng)計(jì)數(shù)據(jù)如下表:廣告費(fèi)用x(萬(wàn)元)3456銷售額y(萬(wàn)元)25304045根據(jù)上表可得回歸方程x中的為7.據(jù)此模型預(yù)測(cè)廣告費(fèi)用為10萬(wàn)元時(shí)銷售額為_(kāi)萬(wàn)元答案73.5解析由題表可知,4.5,35,代入回歸方程7x,得3.5,所以回歸方程為7x3.5.所以當(dāng)x10時(shí),7×103.573.5.三、解答題920xx·河北三市二聯(lián)下表是高三某位文科生連續(xù)5次月考的歷史、政治的成績(jī),結(jié)果統(tǒng)計(jì)如下:月份91011121歷史(x分)7981838587政治(y分)7779798283(1)求該生5次月考?xì)v史成績(jī)的平均分和政治成績(jī)的方差;(2)一般來(lái)說(shuō),學(xué)生的歷史成績(jī)與政治成績(jī)有較強(qiáng)的線性相關(guān)關(guān)系,根據(jù)上表提供的數(shù)據(jù),求兩個(gè)變量x、y的線性回歸方程x.附:, 解(1)×(7981838587)83,×(7779798283)80,s×(7780)2(7980)2(7980)2(8280)2(8380)24.8.(2)(xi)(yi)30,(xi)240,0.75, 17.75.則所求的線性回歸方程為0.75x17.75.1020xx·江淮十校一聯(lián)某學(xué)校在高一、高二兩個(gè)年級(jí)學(xué)生中各抽取100人的樣本,進(jìn)行普法知識(shí)調(diào)查,其結(jié)果如下表:高一高二總數(shù)合格人數(shù)70x150不合格人數(shù)y2050總數(shù)100100200(1)求x,y的值;(2)有沒(méi)有99%的把握認(rèn)為“高一、高二兩個(gè)年級(jí)這次普法知識(shí)調(diào)查結(jié)果有差異”;(3)用分層抽樣的方法從樣本的不合格同學(xué)中抽取5人的輔導(dǎo)小組,在5人中隨機(jī)選2人,這2人中,正好高一、高二各1人的概率為多少?參考公式:225.0246.6357.87910.82897.5%99%99.5%99.9%解(1)x80,y30.(2)由(1)得22.67<6.635,所以沒(méi)有99%的把握認(rèn)為“高一、高二兩個(gè)年級(jí)這次普法知識(shí)調(diào)查結(jié)果有差異”(3)由分層抽樣得從高一抽取3人,設(shè)為A,B,C,從高二抽取2人,設(shè)為1,2.從5人中選2人,有(AB),(AC),(A1),(A2),(BC),(B1),(B2),(C1),(C2),(12),共10種選法其中正好高一、高二各1人,有(A1),(A2),(B1),(B2),(C1),(C2),共6種選法所以所求概率為P.1120xx·重慶測(cè)試從甲、乙兩部門(mén)中各任選10名員工進(jìn)行職業(yè)技能測(cè)試,測(cè)試成績(jī)(單位:分)數(shù)據(jù)的莖葉圖如圖1所示:(1)分別求出甲、乙兩組數(shù)據(jù)的中位數(shù),并比較兩組數(shù)據(jù)的分散程度(只需給出結(jié)論);(2)甲組數(shù)據(jù)頻率分布直方圖如圖2所示,求a、b、c的值;(3)從甲、乙兩組數(shù)據(jù)中各任取一個(gè),求所取兩數(shù)之差的絕對(duì)值大于20的概率解(1)甲組數(shù)據(jù)的中位數(shù)為78.5,乙組數(shù)據(jù)的中位數(shù)為78.5.從莖葉圖可以看出,甲組數(shù)據(jù)比較集中,乙組數(shù)據(jù)比較分散(2)由圖易知a0.05,b0.02,c0.01.(3)從甲、乙兩組數(shù)據(jù)中各任取一個(gè),得到的所有基本事件共有100個(gè),其中滿足“兩數(shù)之差的絕對(duì)值大于20”的基本事件有16個(gè),故所求概率P.12為了調(diào)查學(xué)生星期天晚上學(xué)習(xí)時(shí)間的利用問(wèn)題,某校從高二年級(jí)1000名學(xué)生(其中走讀生450名,住宿生550名)中,采用分層抽樣的方法抽取n名學(xué)生進(jìn)行問(wèn)卷調(diào)查根據(jù)問(wèn)卷取得了這n名同學(xué)星期天晚上學(xué)習(xí)時(shí)間(單位:分鐘)的數(shù)據(jù),按照以下區(qū)間分為八組:0,30),30,60),60,90),90,120),120,150),150, 180),180,210),210, 240),得到頻率分布直方圖如圖,已知抽取的學(xué)生中星期天晚上學(xué)習(xí)時(shí)間少于60分鐘的人數(shù)為5人(1)求n的值并補(bǔ)全頻率分布直方圖;(2)如果把“學(xué)生晚上學(xué)習(xí)時(shí)間達(dá)到兩小時(shí)”作為是否充分利用時(shí)間的標(biāo)準(zhǔn),對(duì)抽取的n名學(xué)生,完成下列2×2列聯(lián)表:利用時(shí)間充分利用時(shí)間不充分總計(jì)走讀生住宿生10總計(jì)據(jù)此資料,是否有95%的把握認(rèn)為學(xué)生“利用時(shí)間是否充分”與走讀、住宿有關(guān)?(3)若在第組、第組共抽出2人調(diào)查影響有效利用時(shí)間的原因,求抽出的2人中第組、第組各有1人的概率參考數(shù)據(jù):P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解(1)設(shè)第i組的頻率為Pi(i1,2,8),由圖可知P1×30,P2×30,學(xué)習(xí)時(shí)間少于60分鐘的頻率為P1P2,由題意得n×5,n100.又P3×30,P5×30,P6×30,P7×30,P8×30,P41(P1P2P3P5P6P7P8),第組的高度為h×,頻率分布直方圖如圖(2)由頻率分布直方圖可知,在抽取的100人中,“住宿生”有55人,“走讀生”有45人,利用時(shí)間不充分的有100×(P1P2P3P4)25人,從而2×2列聯(lián)表如下:利用時(shí)間充分利用時(shí)間不充分總計(jì)走讀生301545住宿生451055總計(jì)7525100將2×2列聯(lián)表中的數(shù)據(jù)代入公式計(jì)算,得K23.030.3.030<3.841,沒(méi)有理由認(rèn)為學(xué)生“利用時(shí)間是否充分”與走讀、住宿有關(guān)(3)由題可知第組人數(shù)為100×P12(人),第組人數(shù)為100×P23(人),記第組的2人為A1,A2,第組的3人為B1,B2,B3,則“從5人中抽取2人”所構(gòu)成的基本事件有A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3”,共10個(gè)基本事件;記“抽取2人中第組、第組各有1人”記作事件A,則事件A所包含的基本事件有A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,共6個(gè)基本事件,P(A),即抽出的2人中第組、第組各有1人的概率為.典題例證20xx·全國(guó)卷某公司計(jì)劃購(gòu)買(mǎi)1臺(tái)機(jī)器,該種機(jī)器使用三年后即被淘汰機(jī)器有一易損零件,在購(gòu)進(jìn)機(jī)器時(shí),可以額外購(gòu)買(mǎi)這種零件作為備件,每個(gè)200元在機(jī)器使用期間,如果備件不足再購(gòu)買(mǎi),則每個(gè)500元現(xiàn)需決策在購(gòu)買(mǎi)機(jī)器時(shí)應(yīng)同時(shí)購(gòu)買(mǎi)幾個(gè)易損零件,為此搜集并整理了100臺(tái)這種機(jī)器在三年使用期內(nèi)更換的易損零件數(shù),得下面柱狀圖:記x表示1臺(tái)機(jī)器在三年使用期內(nèi)需更換的易損零件數(shù),y表示1臺(tái)機(jī)器在購(gòu)買(mǎi)易損零件上所需的費(fèi)用(單位:元),n表示購(gòu)機(jī)的同時(shí)購(gòu)買(mǎi)的易損零件數(shù)(1)若n19,求y與x的函數(shù)解析式;(2)若要求“需更換的易損零件數(shù)不大于n”的頻率不小于0.5,求n的最小值;(3)假設(shè)這100臺(tái)機(jī)器在購(gòu)機(jī)的同時(shí)每臺(tái)都購(gòu)買(mǎi)19個(gè)易損零件,或每臺(tái)都購(gòu)買(mǎi)20個(gè)易損零件,分別計(jì)算這100臺(tái)機(jī)器在購(gòu)買(mǎi)易損零件上所需費(fèi)用的平均數(shù),以此作為決策依據(jù),購(gòu)買(mǎi)1臺(tái)機(jī)器的同時(shí)應(yīng)購(gòu)買(mǎi)19個(gè)還是20個(gè)易損零件?審題過(guò)程讀懂題意與柱狀圖,用分段函數(shù)表示y與x的函數(shù)關(guān)系把頻率問(wèn)題轉(zhuǎn)化為頻數(shù)問(wèn)題,即可求出n的最小值,分別求出n19,n20時(shí)的平均數(shù),比較大小即可得出結(jié)論.(1)當(dāng)x19時(shí),y3800;當(dāng)x>19時(shí),y3800500(x19)500x5700.所以y與x的函數(shù)解析式為y(xN)(2)由柱狀圖知,需更換的零件數(shù)不大于18的頻率為0.46,不大于19的頻率為0.7,故n的最小值為19. (3)若每臺(tái)機(jī)器在購(gòu)機(jī)同時(shí)都購(gòu)買(mǎi)19個(gè)易損零件,則這100臺(tái)機(jī)器中有70臺(tái)在購(gòu)買(mǎi)易損零件上的費(fèi)用為3800,20臺(tái)的費(fèi)用為4300,10臺(tái)的費(fèi)用為4800,因此這100臺(tái)機(jī)器在購(gòu)買(mǎi)易損零件上所需費(fèi)用的平均數(shù)為(3800×704300×204800×10)4000.若每臺(tái)機(jī)器在購(gòu)機(jī)同時(shí)都購(gòu)買(mǎi)20個(gè)易損零件,則這100臺(tái)機(jī)器中有90臺(tái)在購(gòu)買(mǎi)易損零件上的費(fèi)用為4000,10臺(tái)的費(fèi)用為4500,因此這100臺(tái)機(jī)器在購(gòu)買(mǎi)易損零件上所需費(fèi)用的平均數(shù)為(4000×904500×10)4050.比較兩個(gè)平均數(shù)可知,購(gòu)買(mǎi)1臺(tái)機(jī)器的同時(shí)應(yīng)購(gòu)買(mǎi)19個(gè)易損零件模型歸納求解統(tǒng)計(jì)與概率綜合問(wèn)題的模型示意圖如下: