高三數(shù)學(xué)第一篇七 概率與統(tǒng)計 第1講 統(tǒng)計與統(tǒng)計案例 理
第第1 1講講 統(tǒng)計與統(tǒng)計案例統(tǒng)計與統(tǒng)計案例考情分析考情分析年份 卷別題號考查內(nèi)容命題規(guī)律2017 19(2)正態(tài)分布的性質(zhì)及應(yīng)用統(tǒng)計的主要內(nèi)容包括隨機抽樣、用樣本估計總體、變量的相關(guān)性.近年來把統(tǒng)計和概率結(jié)合起來命制解答題是高考考查的一個趨勢.對統(tǒng)計案例的考查一般以選擇題或填空題的形式出現(xiàn).13,18二項分布的方差;頻率分布直方圖及獨立性檢驗3,18折線圖的識別,頻率分布表2016 4,18統(tǒng)計圖表的應(yīng)用,折線圖、相關(guān)性檢驗、線性回歸方程及其應(yīng)用2015 19散點圖、求回歸方程、回歸分析3條形圖、兩變量間的相關(guān)性總綱目錄考點一 抽樣方法考點二 用樣本估計總體(高頻考點)考點三 統(tǒng)計案例考點一 抽樣方法抽樣方法主要有簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣三種,這三種抽樣方法各自適用不同特點的總體,但無論哪種抽樣方法,每一個個體被抽到的概率都是相等的,都等于樣本容量和總體容量的比值.典型例題典型例題(2017江蘇,3,5分)某工廠生產(chǎn)甲、乙、丙、丁四種不同型號的產(chǎn)品,產(chǎn)量分別為200,400,300,100件.為檢驗產(chǎn)品的質(zhì)量,現(xiàn)用分層抽樣的方法從以上所有的產(chǎn)品中抽取60件進(jìn)行檢驗,則應(yīng)從丙種型號的產(chǎn)品中抽取件.解析解析從丙種型號的產(chǎn)品中抽取的件數(shù)為60=18.300200400300 100答案答案18方法歸納方法歸納解決抽樣問題的方法(1)解決此類題目的關(guān)鍵是深刻理解各種抽樣方法的特點和適用范圍.(2)在系統(tǒng)抽樣的過程中,要注意分段間隔,需要抽取n個個體,樣本就需要分成n個組,則分段間隔為(N為樣本容量),首先確定在第一組中抽取的個體的號碼,再從后面的每組中按規(guī)則抽取每個個體.Nn跟蹤集訓(xùn)跟蹤集訓(xùn)1.(2017貴州貴陽檢測)某高校有教授120人,副教授100人,講師80人,助教60人,現(xiàn)用分層抽樣的方法從以上所有老師中抽取一個容量為n的樣本.已知從講師中抽取的人數(shù)為16,那么n=.答案答案72解析解析依題意得,=,由此解得n=72.80120 100806016n2.從編號為0,1,2,79的80件產(chǎn)品中,采用系統(tǒng)抽樣的方法抽取容量是5的樣本,若編號為28的產(chǎn)品在樣本中,則該樣本中產(chǎn)品的最大編號為.答案答案76解析解析根據(jù)系統(tǒng)抽樣的特點,共有80個產(chǎn)品,抽取5個樣品,則可得組距為=16.又其中有1個產(chǎn)品的編號為28,則與之相鄰的為12和44,故所取5個樣品的編號依次為12,28,44,60,76,即最大的編號為76.805考點二 用樣本估計總體(高頻考點)命題點命題點1.用統(tǒng)計圖表估計總體.2.用樣本的數(shù)字特征估計總體特征.1.直方圖的兩個結(jié)論(1)小長方形的面積=組距=頻率.(2)各小長方形的面積之和等于1.頻率組距2.統(tǒng)計中的四個數(shù)字特征(1)眾數(shù):在樣本數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個數(shù)據(jù).(2)中位數(shù):樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù).如果數(shù)據(jù)的個數(shù)為偶數(shù),就取中間兩個數(shù)據(jù)的平均數(shù)作為中位數(shù).(3)平均數(shù):樣本數(shù)據(jù)的算術(shù)平均數(shù),即=(x1+x2+xn).(4)方差與標(biāo)準(zhǔn)差方差:s2=(x1-)2+(x2-)2+(xn-)2.標(biāo)準(zhǔn)差:s=.x1n1nxxx222121()()() nxxxxxxn典型例題典型例題(2016北京,17,13分)某市居民用水?dāng)M實行階梯水價.每人每月用水量中不超過w立方米的部分按4元/立方米收費,超出w立方米的部分按10元/立方米收費.從該市隨機調(diào)查了10000位居民,獲得了他們某月的用水量數(shù)據(jù),整理得到如下頻率分布直方圖:(1)如果w為整數(shù),那么根據(jù)此次調(diào)查,為使80%以上居民在該月的用水價格為4元/立方米,w至少定為多少?(2)假設(shè)同組中的每個數(shù)據(jù)用該組區(qū)間的右端點值代替.當(dāng)w=3時,估計該市居民該月的人均水費.解析解析(1)由用水量的頻率分布直方圖知,該市居民該月用水量在區(qū)間0.5,1,(1,1.5,(1.5,2,(2,2.5,(2.5,3內(nèi)的頻率依次為0.1,0.15,0.2,0.25,0.15.所以該月用水量不超過3立方米的居民占85%,用水量不超過2立方米的居民占45%.依題意,w至少定為3.(2)由用水量的頻率分布直方圖及題意,得居民該月用水費用的數(shù)據(jù)分組與頻率分布表:根據(jù)題意,該市居民該月的人均水費估計為:40.1+60.15+80.2+100.25+120.15+170.05+220.05+270.05=10.5(元).組號12345678分組2,4(4,6(6,8(8,10(10,12(12,17(17,22(22,27頻率0.10.150.20.250.150.050.050.05方法歸納方法歸納1.眾數(shù)、中位數(shù)、平均數(shù)與直方圖的關(guān)系(1)眾數(shù)為頻率分布直方圖中最高矩形的底邊中點的橫坐標(biāo).(2)中位數(shù)為平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點的橫坐標(biāo).(3)平均數(shù)等于頻率分布直方圖中每個小矩形的面積乘小矩形底邊中點的橫坐標(biāo)之和.2.方差的計算與含義計算方差首先要計算平均數(shù),再按照方差的計算公式進(jìn)行計算,方差和標(biāo)準(zhǔn)差是描述一個樣本和總體的波動大小的特征數(shù),方差、標(biāo)準(zhǔn)差越大說明波動越大.跟蹤集訓(xùn)跟蹤集訓(xùn)1.將容量為n的樣本中的數(shù)據(jù)分成六組,繪制頻率分布直方圖.若第一組至第六組數(shù)據(jù)的頻率之比為2 3 4 6 4 1,且前三組數(shù)據(jù)的頻數(shù)之和等于27,則n=()A.40B.50C.60D.70答案答案 C根據(jù)六組數(shù)據(jù)的頻率之比就是頻數(shù)之比,及前三組數(shù)據(jù)的頻數(shù)之和是27,得n=27,解得n=60.故選C.23423464 1 2.(2017廣西三市第一次聯(lián)考)在如圖所示一組數(shù)據(jù)的莖葉圖中,有一個數(shù)字被污染后模糊不清,但曾計算得該組數(shù)據(jù)的極差與中位數(shù)之和為61,則被污染的數(shù)字為()A.1B.2C.3D.4答案答案B由題可知該組數(shù)據(jù)的極差為48-20=28,則該組數(shù)據(jù)的中位數(shù)為61-28=33,易得被污染的數(shù)字為2.3.(2017成都第二次診斷性檢測)在一個容量為5的樣本中,數(shù)據(jù)均為整數(shù),已求出其平均數(shù)為10,但墨水污損了兩個數(shù)據(jù),其中一個數(shù)據(jù)的十位數(shù)字1未被污損,即9,10,11,1,那么這組數(shù)據(jù)的方差s2可能的最大值是.答案答案32.8解析解析設(shè)這組數(shù)據(jù)的最后兩個數(shù)分別是10+x,y(x為0,9中的自然數(shù),y為整數(shù)),則9+10+11+(10+x)+y=50,得x+y=10,故y=10-x,故s2=+x2,顯然x最大取9時,s2有最大值32.8.221 0 1()5xx 2525考點三 統(tǒng)計案例1.線性回歸方程=-;(,)稱為樣本點的中心.1221,niiiniix ynxyybxabxnx方程稱為線性回歸方程 其中aybxxy2.隨機變量K2=(K2也可表示為2).若K23.841,則有95%的把握說兩個事件有關(guān);若K26.635,則有99%的把握說兩個事件有關(guān).2()()()()()()abcd adbcab cd ac bd 典型例題典型例題(2017課標(biāo)全國,18,12分)海水養(yǎng)殖場進(jìn)行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:(1)設(shè)兩種養(yǎng)殖方法的箱產(chǎn)量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg,新養(yǎng)殖法的箱產(chǎn)量不低于50kg”,估計A的概率;(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān);箱產(chǎn)量50kg箱產(chǎn)量50kg舊養(yǎng)殖法新養(yǎng)殖法(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,求新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值(精確到0.01).附:,K2=,其中n=a+b+c+d.解析解析(1)記B表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,C表示事件“新養(yǎng)殖法的箱產(chǎn)量不低于50kg”.由題意知P(A)=P(BC)=P(B)P(C).舊養(yǎng)殖法的箱產(chǎn)量低于50kg的頻率為(0.012+0.014+0.024+0.034+0.042()()()()()n adbcab cd ac bd0)5=0.62,故P(B)的估計值為0.62.新養(yǎng)殖法的箱產(chǎn)量不低于50kg的頻率為(0.068+0.046+0.010+0.008)5=0.66,故P(C)的估計值為0.66.因此,事件A的概率估計值為0.620.66=0.4092.(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得如下列聯(lián)表:箱產(chǎn)量6.635,故有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān).(3)因為新養(yǎng)殖法的箱產(chǎn)量頻率分布直方圖中,箱產(chǎn)量低于50kg的直方圖面積為(0.004+0.020+0.044)5=0.340.5,故新養(yǎng)殖法箱產(chǎn)量的中位數(shù)的估計值為50+52.35(kg).2200 (62 6634 38)100 100 96 1040.50.340.068方法歸納解決統(tǒng)計案例應(yīng)注意的問題(1)求回歸直線方程的關(guān)鍵有兩點:一是把相關(guān)數(shù)據(jù)代入公式準(zhǔn)確計算;二是抓住樣本點的中心(,)必在回歸直線上的特性.(2)求解獨立性檢驗問題時要注意:22列聯(lián)表中的數(shù)據(jù)與公式中各個字母的對應(yīng),不能混淆;計算得到K2之后的結(jié)論.xy跟蹤集訓(xùn)跟蹤集訓(xùn)面對競爭日益激烈的消費市場,眾多商家不斷擴大自己的銷售市場,以降低生產(chǎn)成本.某白酒釀造企業(yè)市場部對該企業(yè)9月份的產(chǎn)品銷量x(單位:千箱)與單位成本y(單位:元)的資料進(jìn)行線性回歸分析,得到結(jié)果如下:=,=71,=79,xiyi=1481.則銷量每增加1千箱,單位成本約下降元(結(jié)果保留5位有效數(shù)字).附:回歸直線的斜率和截距的最小二乘法公式分別為:=,=x72y61i2ix61ib1221niiiniix ynxyxnxa-.ybx答案答案1.8182解析解析由題意知=-1.8182,=71-(-1.8182)77.364,所以=-1.8182x+77.364,所以銷量每增加1千箱,則單位成本約下降1.8182元.b271481 671277962 a72y1.(2017課標(biāo)全國,3,5分)某城市為了解游客人數(shù)的變化規(guī)律,提高旅游服務(wù)質(zhì)量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬人)的數(shù)據(jù),繪制了下面的折線圖.根據(jù)該折線圖,下列結(jié)論錯誤的是()A.月接待游客量逐月增加B.年接待游客量逐年增加隨堂檢測隨堂檢測C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩(wěn)答案答案A由題中折線圖可知,每年的月接待游客量從8月份開始有下降趨勢.故選A.2.(2017湖南五市十校聯(lián)考)某中學(xué)奧數(shù)培訓(xùn)班共有14人,分為兩個小組,在一次階段測試中兩個小組成績的莖葉圖如圖所示,其中甲組學(xué)生成績的平均數(shù)是88,乙組學(xué)生成績的中位數(shù)是89,則n-m的值是()A.5B.6C.7D.8答案答案B由甲組學(xué)生成績的平均數(shù)是88,可得=88,解得m=3.由乙組學(xué)生成績的中位數(shù)是89,可得n=9,所以n-m=6,故選B.7080 390 3(846825)7m 3.(2017山東,5,5分)為了研究某班學(xué)生的腳長x(單位:厘米)和身高y(單位:厘米)的關(guān)系,從該班隨機抽取10名學(xué)生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與x之間有線性相關(guān)關(guān)系,設(shè)其回歸直線方程為 =x+.已知xi=225,yi=1600,=4.該班某學(xué)生的腳長為24,據(jù)此估計其身高為()A.160B.163C.166D.170yba101i101ib答案答案 C由題意可知=22.5,=160,160=422.5+,解得=70,=4x+70,x=24時,=424+70=166.故選C.xyaayy4.為了研究霧霾天氣的治理,某課題組對部分城市進(jìn)行空氣質(zhì)量調(diào)查,按地域特點把這些城市分成甲、乙、丙三組.已知三組城市的個數(shù)分別為4,y,z,依次構(gòu)成等差數(shù)列,且4,y,z+4成等比數(shù)列,若用分層抽樣抽取6個城市,則乙組中應(yīng)抽取的城市個數(shù)為.答案答案2解析解析由題意可得即解得z=12或z=-4(舍去),故y=8.所以甲、乙、丙三組城市的個數(shù)分別為4,8,12.因為一共要抽取6個城市,所以抽樣比為=.故乙組中應(yīng)抽取的城市個數(shù)為8=2.224,4(4),yzyz22,2416.zyyz648 12 14145.(2017陜西高三教學(xué)質(zhì)量檢測試題(一)已知一組正數(shù)x1,x2,x3,x4的方差s2=(+-16),則數(shù)據(jù)x1+2,x2+2,x3+2,x4+2的平均數(shù)為.1421x22x23x24x答案答案4解析解析由方差公式s2=(x1-)2+(x2-)2+(x3-)2+(x4-)2,得s2=(+)-,又已知s2=(+-16)=(+)-4,所以=4,所以=2,故(x1+2)+(x2+2)+(x3+2)+(x4+2)=+2=4.14xxxx1421x22x23x24x2x1421x22x23x24x1421x22x23x24x2xx14x