高三數(shù)學(xué)第一篇七 概率與統(tǒng)計(jì)刺 第1講 統(tǒng)計(jì)與統(tǒng)計(jì)案例 文
第第1 1講講 統(tǒng)計(jì)與統(tǒng)計(jì)案例統(tǒng)計(jì)與統(tǒng)計(jì)案例考情分析考情分析總綱目錄考點(diǎn)一 抽樣方法考點(diǎn)二 用樣本估計(jì)總體(高頻考點(diǎn))考點(diǎn)三 回歸分析考點(diǎn)四 獨(dú)立性檢測考點(diǎn)一 抽樣方法1.簡單隨機(jī)抽樣的特點(diǎn)是從總體中逐個抽取.適用范圍:總體中的個體數(shù)較少. 2.系統(tǒng)抽樣的特點(diǎn)是將總體均分成幾部分,按事先確定的規(guī)則在各部分中抽取.適用范圍:總體中的個體數(shù)較多. 3.分層抽樣的特點(diǎn)是將總體分成幾層,分層進(jìn)行抽取.適用范圍:總體由差異明顯的幾部分組成.典型例題典型例題(1)(2017陜西西安六校聯(lián)考)某班對八校聯(lián)考成績進(jìn)行分析,利用隨機(jī)數(shù)表抽取樣本時,先將60個同學(xué)按01,02,03,60進(jìn)行編號,然后從隨機(jī)數(shù)表第9行第5列的數(shù)開始向右讀,則選出的第6個個體的編號是( )(注:下面摘取了隨機(jī)數(shù)表的第8行和第9行)63016378591695556719981050717512867358074439523879(第8行)33211234297864560782524207443815510013429966027954(第9行)A.07 B.25 C.42 D.52(2)(2017江蘇,3,5分)某工廠生產(chǎn)甲、乙、丙、丁四種不同型號的產(chǎn)品,產(chǎn)量分別為200,400,300,100件.為檢驗(yàn)產(chǎn)品的質(zhì)量,現(xiàn)用分層抽樣的方法從以上所有的產(chǎn)品中抽取60件進(jìn)行檢驗(yàn),則應(yīng)從丙種型號的產(chǎn)品中抽取 件.答案答案(1)D(2)18解析解析(1)依題意得,依次選出的個體的編號分別是12,34,29,56,07,52,因此選出的第6個個體的編號是52,選D.(2)應(yīng)從丙種型號的產(chǎn)品中抽取60=18(件).300200400300 100方法歸納方法歸納抽樣方法主要有簡單隨機(jī)抽樣、系統(tǒng)抽樣和分層抽樣三種,這三種抽樣方法各自適用不同特點(diǎn)的總體,但無論哪種抽樣方法,每一個個體被抽到的概率都是相等的,都等于樣本容量與總體個體數(shù)的比值.跟蹤集訓(xùn)跟蹤集訓(xùn)1.(2017江西南昌第一次模擬)某校為了解學(xué)生學(xué)習(xí)的情況,采用分層抽樣的方法從高一1 000人、高二1 200人、高三n人中抽取81人進(jìn)行問卷調(diào)查,已知高二被抽取的人數(shù)為30,那么n=()A.860B.720C.1 020D.1 040答案答案 D根據(jù)分層抽樣方法,得81=30,可得n=1 040.故選D.1 2001 000 1 200n2.已知某商場新進(jìn)3 000袋奶粉,為檢測是否達(dá)標(biāo),現(xiàn)采用系統(tǒng)抽樣的方法從中抽取150袋進(jìn)行檢測,將3 000袋奶粉按1,2,3 000隨機(jī)編號,若第一組抽出的號碼是11,則第六十一組抽出的號碼為 .答案答案1 211解析解析由題意知抽樣間隔k=20,因?yàn)榈谝唤M抽出的號碼是11,則第六十一組抽出的號碼為11+6020=1 211.3 000150考點(diǎn)二 用樣本估計(jì)總體(高頻考點(diǎn))命題點(diǎn)1.用樣本的頻率分布估計(jì)總體分布;2.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征.1.頻率分布直方圖的兩個結(jié)論(1)小長方形的面積=組距=頻率.(2)各小長方形的面積之和等于1.頻率組距2.統(tǒng)計(jì)中的四個數(shù)字特征(1)眾數(shù):在樣本數(shù)據(jù)中,出現(xiàn)次數(shù)最多的那個數(shù)據(jù).(2)中位數(shù):樣本數(shù)據(jù)中,將數(shù)據(jù)按大小排列,位于最中間的數(shù)據(jù).如果數(shù)據(jù)的個數(shù)為偶數(shù),就取中間兩個數(shù)據(jù)的平均數(shù)作為中位數(shù).(3)平均數(shù):樣本數(shù)據(jù)的算術(shù)平均數(shù),即=(x1+x2+xn).(4)方差與標(biāo)準(zhǔn)差方差:s2=(x1-)2+(x2-)2+(xn-)2.標(biāo)準(zhǔn)差:s=.x1n1nxxx222121()()() nxxxxxxn典型例題典型例題某公司為了解用戶對其產(chǎn)品的滿意度,從A,B兩地區(qū)分別隨機(jī)調(diào)查了40個用戶,根據(jù)用戶對產(chǎn)品的滿意度評分,得到A地區(qū)用戶滿意度評分的頻率分布直方圖和B地區(qū)用戶滿意度評分的頻數(shù)分布表.B地區(qū)用戶滿意度評分的頻數(shù)分布表滿意度評分分組 50,60)60,70)70,80)80,90)90,100頻數(shù)2814106(1)作出B地區(qū)用戶滿意度評分的頻率分布直方圖,并通過直方圖比較兩地區(qū)滿意度評分的平均值及分散程度(不要求計(jì)算出具體值,給出結(jié)論即可);滿意度評分低于70分70分到89分不低于90分滿意度等級不滿意滿意非常滿意(2)根據(jù)用戶滿意度評分,將用戶的滿意度分為三個等級:估計(jì)哪個地區(qū)用戶的滿意度等級為不滿意的概率大,說明理由. 解析(1)通過兩地區(qū)用戶滿意度評分的頻率分布直方圖可以看出,B地區(qū)用戶滿意度評分的平均值高于A地區(qū)用戶滿意度評分的平均值;B地區(qū)用戶滿意度評分比較集中,而A地區(qū)用戶滿意度評分比較分散.(2)A地區(qū)用戶的滿意度等級為不滿意的概率大.記CA表示事件:“A地區(qū)用戶的滿意度等級為不滿意”;CB表示事件:“B地區(qū)用戶的滿意度等級為不滿意”.由直方圖得P(CA)的估計(jì)值為(0.01+0.02+0.03)10=0.6,P(CB)的估計(jì)值為(0.005+0.02)10=0.25.所以A地區(qū)用戶的滿意度等級為不滿意的概率大.方法歸納方法歸納(1)關(guān)于平均數(shù)、方差的計(jì)算樣本數(shù)據(jù)的平均數(shù)與方差的計(jì)算關(guān)鍵在于準(zhǔn)確記憶公式,要特別注意區(qū)分方差與標(biāo)準(zhǔn)差,不能混淆,標(biāo)準(zhǔn)差是方差的算術(shù)平方根.(2)求解頻率分布直方圖中相關(guān)數(shù)據(jù)的兩個注意點(diǎn)小長方形的面積表示頻率,其縱軸是,而不是頻率.各組數(shù)據(jù)頻率之比等于對應(yīng)小長方形的高度之比.頻率組距跟蹤集訓(xùn)跟蹤集訓(xùn)1.(2017課標(biāo)全國,2,5分)為評估一種農(nóng)作物的種植效果,選了n塊地作試驗(yàn)田.這n塊地的畝產(chǎn)量(單位:kg)分別為x1,x2,xn,下面給出的指標(biāo)中可以用來評估這種農(nóng)作物畝產(chǎn)量穩(wěn)定程度的是()A.x1,x2,xn的平均數(shù) B.x1,x2,xn的標(biāo)準(zhǔn)差C.x1,x2,xn的最大值 D.x1,x2,xn的中位數(shù)答案答案 B統(tǒng)計(jì)問題中,體現(xiàn)數(shù)據(jù)的穩(wěn)定程度的指標(biāo)為數(shù)據(jù)的方差或標(biāo)準(zhǔn)差.故選B.2.(2017湖北武漢武昌調(diào)研)我國是世界上嚴(yán)重缺水的國家,城市缺水問題較為突出.某市政府為了鼓勵居民節(jié)約用水,計(jì)劃在本市試行居民生活用水定額管理制度,即確定一個合理的居民月用水量標(biāo)準(zhǔn)x(噸),月用水量不超過x的部分按平價收費(fèi),超出x的部分按議價收費(fèi).為了了解全市居民用水量的分布情況,通過抽樣,獲得了某年100位居民的月均用水量(單位:噸),將數(shù)據(jù)按照0,0.5,(0.5,1,(4,4.5分成9組,制成了如圖所示的頻率分布直方圖.(1)求頻率分布直方圖中a的值;(2)已知該市有80萬居民,估計(jì)全市居民中月均用水量不低于3噸的人數(shù),并說明理由;(3)若該市政府希望使85%的居民每月的用水量不超過標(biāo)準(zhǔn)x(噸),估計(jì)x的值,并說明理由.解析解析(1)由(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)0.5=1,解得a=0.30.(2)由頻率分布直方圖知,100位居民每人月均用水量不低于3噸的頻率為(0.12+0.08+0.04)0.5=0.12.則估計(jì)全市80萬居民中月均用水量不低于3噸的人數(shù)為800 0000.12=96 000.(3)前6組的頻率之和是(0.08+0.16+0.30+0.40+0.52+0.30)0.5=0.880.85,前5組的頻率之和為(0.08+0.16+0.30+0.40+0.52)0.5=0.730.85,2.5x3,由0.3(x-2.5)=0.85-0.73,解得x=2.9.因此,估計(jì)月用水量標(biāo)準(zhǔn)為2.9噸時,85%的居民每月的用水量不超過標(biāo)準(zhǔn).考點(diǎn)三 回歸分析1.線性回歸方程方程=x+稱為線性回歸方程,其中=,=-,(,)稱為樣本點(diǎn)的中心.2.樣本數(shù)據(jù)的相關(guān)系數(shù)rr=反映樣本數(shù)據(jù)的相關(guān)程度,|r|越大,相關(guān)性越強(qiáng).典型例題ybab1221niiiniix ynxyxnxaybxxy12211()(),()()niiinniiiixxyyxxyy(2017課標(biāo)全國,19,12分)為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗(yàn)員每隔30 min 從該生產(chǎn)線上隨機(jī)抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗(yàn)員在一天內(nèi)依次抽取的16個零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04 抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95經(jīng)計(jì)算得=xi=9.97,s=0.212,18.439,(xi-)(i-8.5)=-2.78,其中xi為抽取的第i個零件的尺寸,i=1,2,16.(1)求(xi,i)(i=1,2,16)的相關(guān)系數(shù)r,并回答是否可以認(rèn)為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變小(若|r|0.25,則可以認(rèn)為零件的尺寸不隨生產(chǎn)過程的進(jìn)行而系統(tǒng)地變大或變小);(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在(-3s,+3s)之外的零件,就認(rèn)為這條生產(chǎn)線在這一天的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查.x116161i16211()16iixx1621(8.5)ii161ixxx(i)從這一天抽檢的結(jié)果看,是否需對當(dāng)天的生產(chǎn)過程進(jìn)行檢查?(ii)在(-3s,+3s)之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計(jì)這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值與標(biāo)準(zhǔn)差.(精確到0.01)附:樣本(xi,yi)(i=1,2,n)的相關(guān)系數(shù)r=.0.09.xx12211()()()()niiinniiiixxyyxxyy0.008解析解析(1)由樣本數(shù)據(jù)得(xi,i)(i=1,2,16)的相關(guān)系數(shù)為r=-0.18.由于|r|0時,表明兩個變量正相關(guān);當(dāng)r2.706時,有90%的把握判定變量A,B有關(guān)聯(lián);(3)當(dāng)K23.841時,有95%的把握判定變量A,B有關(guān)聯(lián);(4)當(dāng)K26.635時,有99%的把握判定變量A,B有關(guān)聯(lián);(5)當(dāng)K210.828時,有99.9%的把握判定變量A,B有關(guān)聯(lián).典型例題典型例題(2017課標(biāo)全國,19,12分)海水養(yǎng)殖場進(jìn)行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機(jī)抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:(1)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,估計(jì)A的概率;(2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān); 箱產(chǎn)量50 kg箱產(chǎn)量50 kg舊養(yǎng)殖法 新養(yǎng)殖法 (3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對這兩種養(yǎng)殖方法的優(yōu)劣進(jìn)行比較.附:,K2=.2()()()()()n adbcab cd ac bd 箱產(chǎn)量6.635,故有99%的把握認(rèn)為箱產(chǎn)量與養(yǎng)殖方法有關(guān).(3)箱產(chǎn)量的頻率分布直方圖表明:新養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在50 kg到55 kg之間,舊養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在45 kg到50 kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高,因此,可以認(rèn)為新養(yǎng)殖法的箱產(chǎn)量較高且穩(wěn)定,從而新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法.2200 (62 6634 38)100 100 96 104獨(dú)立性檢驗(yàn)的一般步驟(1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表;(2)根據(jù)公式K2=計(jì)算K2的值;(3)查表比較K2與臨界值的大小關(guān)系,作統(tǒng)計(jì)判斷.2()()()()()n adbcab cd ac bd方法歸納方法歸納跟蹤集訓(xùn)跟蹤集訓(xùn)(2017甘肅張掖第一次診斷)中央政府為了應(yīng)對因人口老齡化而造成的勞動力短缺等問題,擬定出臺“延遲退休年齡政策”.為了了解人們對“延遲退休年齡政策”的態(tài)度,責(zé)成人社部進(jìn)行調(diào)研.人社部從網(wǎng)上年齡在1565的人群中隨機(jī)調(diào)查100人,調(diào)查數(shù)據(jù)的頻率分布直方圖和支持“延遲退休”的人數(shù)與年齡的統(tǒng)計(jì)結(jié)果如下:年齡15,25)25,35)35,45)45,55)55,65支持“延遲退休”的人數(shù)155152817(1)由以上統(tǒng)計(jì)數(shù)據(jù)填22列聯(lián)表,并判斷是否有95%的把握認(rèn)為以45歲為分界點(diǎn)的不同人群對“延遲退休年齡政策”的支持度有差異; 45歲以下45歲以上合計(jì)支持 不支持 合計(jì) (2)若以45歲為分界點(diǎn),從不支持“延遲退休”的人中按分層抽樣的方法抽取8人參加某項(xiàng)活動.現(xiàn)從這8人中隨機(jī)抽2人,求至少有1人是45歲以上的概率.附:P(K2k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2=.2()()()()()n adbcab cd ac bd 45歲以下45歲以上合計(jì)支持354580不支持15520合計(jì)5050100解析(1)因?yàn)镵2=6.253.841,所以有95%的把握認(rèn)為以45歲為分界點(diǎn)的不同人群對“延遲退休年齡政策”的支持度有差異.(2)從不支持“延遲退休”的人中,45歲以下應(yīng)抽6人,45歲以上應(yīng)抽2人.記45歲以下的6人為1,2,3,4,5,6;45歲以上的2人為A,B,則有12,3,4,5,6,A,B,23,4,5,6,A,B,34,5,6,A,B,45,6,A,B,56,A,B,6A,B,2100 (35 545 15)50 50 80 20 254AB, 故所求概率為.13281.(2017山東,8,5分)如圖所示的莖葉圖記錄了甲、乙兩組各5名工人某日的產(chǎn)量數(shù)據(jù)(單位:件).若這兩組數(shù)據(jù)的中位數(shù)相等,且平均值也相等,則x和y的值分別為()A.3,5 B.5,5 C.3,7 D.5,7隨堂檢測隨堂檢測答案答案 A由莖葉圖,可得甲組數(shù)據(jù)的中位數(shù)為65,從而乙組數(shù)據(jù)的中位數(shù)也是65,所以y=5.由乙組數(shù)據(jù)59,61,67,65,78,可得乙組數(shù)據(jù)的平均值為66,故甲組數(shù)據(jù)的平均值也為66,從而有=66,解得x=3.故選A.56626574705x2.(2017福建福州綜合質(zhì)量檢測)在檢測一批相同規(guī)格共500 kg航空用耐熱墊片的品質(zhì)時,隨機(jī)抽取了280片,檢測到有5片非優(yōu)質(zhì)品,則這批航空用耐熱墊片中非優(yōu)質(zhì)品約為()A.2.8 kgB.8.9 kgC.10 kgD.28 kg答案答案 B由題意,可知抽到非優(yōu)質(zhì)品的概率為,所以這批航空用耐熱墊片中非優(yōu)質(zhì)品約為500=8.9 kg,故選B.52805280125143.(2017甘肅蘭州模擬)已知某種商品的廣告費(fèi)支出x(單位:萬元)與銷售額y(單位:萬元)之間的部分對應(yīng)數(shù)據(jù)如下表:根據(jù)表中提供的全部數(shù)據(jù),用最小二乘法得出x與y的線性回歸方程為=6.5x+17.5,則表中m的值為()A.45 B.50 C.55 D.60 x24568y304050m70y答案答案 D =5,=38+,因?yàn)榛貧w直線必過樣本點(diǎn)的中心,將此點(diǎn)代入=6.5x+17.5,解得m=60.故選D.x245685y304050705m5m5,385my4.(2017安徽合肥質(zhì)量檢測)某同學(xué)在高三學(xué)年的五次階段性考試中,數(shù)學(xué)成績依次為110,114,121,119,126,則這組數(shù)據(jù)的方差是 .答案答案30.8解析解析五次階段性考試的平均成績=118,所以這組數(shù)據(jù)的方差s2=(110-118)2+(114-118)2+(121-118)2+(119-118)2+(126-118)2=30.8.x110 114 121 119 126515