《高中數(shù)學(xué)講義微專題95統(tǒng)計初步》由會員分享,可在線閱讀,更多相關(guān)《高中數(shù)學(xué)講義微專題95統(tǒng)計初步(6頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、 - 1 -微專題 95 高中涉及的統(tǒng)計學(xué)知識一、基礎(chǔ)知識:(一)隨機(jī)抽樣:1、抽簽法:把總體中的個個體編號,把號碼寫在號簽上,將號簽放在一個容器中攪拌均N勻后,每次從中抽取一個號簽,連續(xù)抽取次,就得到容量為的樣本nn2、系統(tǒng)抽樣:也稱為等間隔抽樣,大致分為以下幾個步驟:(1)先將總體的個個體編號N(2)確定分段間隔,設(shè)樣本容量為,若為整數(shù),則knNnNkn(3)在第一段中用簡單隨機(jī)抽樣確定第一個個體編號 ,則后面每段所確定的個體編號與前l(fā)一段確定的個體編號差距為,例如:第 2 段所確定的個體編號為,第段所確定的klkm個體編號為,直至完成樣本1lmk注:(1)若不是整數(shù),則先用簡單隨機(jī)抽樣剔
2、除若干個個體,使得剩下的個體數(shù)能被Nn整除,再進(jìn)行系統(tǒng)抽樣。例如 501 名學(xué)生所抽取的樣本容量為 10,則先隨機(jī)抽去 1 個,剩n下的個個體參加系統(tǒng)抽樣500(2)利用系統(tǒng)抽樣所抽出的個體編號排成等差數(shù)列,其公差為k3、分層抽樣:也稱為按比例抽樣,是指在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本。分層抽樣后樣本中各層的比例與總體中各個層次的比例相等,這條結(jié)論會經(jīng)常用到(二)頻率分布直方圖:1、頻數(shù)與頻率(1)頻數(shù):指一組數(shù)據(jù)中個別數(shù)據(jù)重復(fù)出現(xiàn)的次數(shù)或一組數(shù)據(jù)在某個確定的范圍內(nèi)出現(xiàn)的數(shù)據(jù)的個數(shù).(2)頻率:是頻數(shù)與數(shù)據(jù)組
3、中所含數(shù)據(jù)的個數(shù)的比,即頻率=頻數(shù)/總數(shù)(3)各試驗(yàn)結(jié)果的頻率之和等于 12、頻率分布直方圖:若要統(tǒng)計每個小組數(shù)據(jù)在樣本容量所占比例大小,則可通過頻率分布表(表格形式)和頻率分布直方圖(圖像形式)直觀的列出(1)極差:一組數(shù)據(jù)中最大值與最小值的差(2)組距:將一組數(shù)據(jù)平均分成若干組(通常 5-12 組) ,則組內(nèi)數(shù)據(jù)的極差稱為組距,所 - 2 -以有組距=極差/組數(shù)(3)統(tǒng)計每組的頻數(shù),計算出每組的頻率,便可根據(jù)頻率作出頻率分布直方圖(4)在頻率分布直方圖中:橫軸按組距分段,縱軸為“頻率/組距”(5)頻率分布直方圖的特點(diǎn): 頻率=,即分布圖中每個小矩形的面積頻率組距組距 因?yàn)楦髟囼?yàn)結(jié)果的頻率之
4、和等于 1,所以可得在頻率分布直方圖中,各個矩形的面積和為1(三)莖葉圖:通??捎糜诮y(tǒng)計和比較兩組數(shù)據(jù),其中莖是指中間的一列數(shù),通常體現(xiàn)數(shù)據(jù)中除了末位數(shù)前面的其他數(shù)位,葉通常代表每個數(shù)據(jù)的末位數(shù)。并按末位數(shù)之前的數(shù)位進(jìn)行分類排列,相同的數(shù)據(jù)需在莖葉圖中體現(xiàn)多次(四)統(tǒng)計數(shù)據(jù)中的數(shù)字特征:1、眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫做眾數(shù)2、中位數(shù):將一組數(shù)據(jù)從小到大排列,位于中間位置的數(shù)稱為中位數(shù),其中若數(shù)據(jù)的總數(shù)為奇數(shù)個,則為中間的數(shù);若數(shù)據(jù)的總數(shù)為偶數(shù)個,則為中間兩個數(shù)的平均值。3、平均數(shù):代表一組數(shù)據(jù)的平均水平,記為,設(shè)一組數(shù)據(jù)為:,則有:x12,nx xx12nxxxxn4、方差:代表數(shù)
5、據(jù)分布的分散程度,記為,設(shè)一組數(shù)據(jù)為:,其平均數(shù)為,2s12,nx xxx則有:,其中越小,說明數(shù)據(jù)越集中 2222121nsxxxxxxn2s5、標(biāo)準(zhǔn)差:也代表數(shù)據(jù)分布的分散程度,為方差的算術(shù)平方根二、典型例題例 1:某校高中部有三個年級,其中高三有學(xué)生人,現(xiàn)采用分層抽樣法抽取一個容量為1000的樣本,已知在高一年級抽取了人,高二年級抽取了人,則高中部共有學(xué)生1857560_人思路:分層抽樣即按比例抽樣,由高一年級和高二年級的人數(shù)可得高三人數(shù)為人,所以抽樣比為,從而總?cè)藬?shù)為人185756050501=1000201185370020答案:3700例 2:某企業(yè)三月中旬生產(chǎn),ABC 三種產(chǎn)品共
6、 3000 件,根據(jù)分層抽樣的結(jié)果;企業(yè)統(tǒng)計 - 3 -員制作了如下的統(tǒng)計表格:產(chǎn)品類別ABC產(chǎn)品數(shù)量(件)1300樣本容量(件)130由于不小心,表格中 AC 產(chǎn)品的有關(guān)數(shù)據(jù)已被污染看不清楚,統(tǒng)計員記得 A 產(chǎn)品的樣本容量比 C 產(chǎn)品的樣本容量多 10,根據(jù)以上信息,可得 C 的產(chǎn)品數(shù)量是 件思路:由產(chǎn)品可得抽樣比為,所以若 A 產(chǎn)品的樣本容量比 C 產(chǎn)品的樣本容量多B130113001010,則 A 產(chǎn)品的數(shù)量比 C 產(chǎn)品的數(shù)量多,且產(chǎn)品數(shù)量和為11010010,A C,從而可解得產(chǎn)品的數(shù)量為 300013001700C800答案:800例 3:某棉紡廠為了了解一批棉花的質(zhì)量,從中隨機(jī)抽測
7、了 100 根棉花纖維的長度(棉花纖維所得數(shù)據(jù)均在區(qū)間中,其頻率分布直方圖如圖所示,則在抽測的 100 根中5,40_根棉花纖維的長度小于 15mm思路:由頻率直方圖的橫縱軸可得:組距為 5mm,所以小于 15mm 的頻率為,所以小于 15mm 共有根 0.010.0150.11000.1=10答案:10例 4:某班甲、乙兩位同學(xué)升入高中以來的 5 次數(shù)學(xué)考試成績的莖葉圖如圖,則乙同學(xué)這 5次數(shù)學(xué)成績的中位數(shù)是 ;已知兩位同學(xué)這 5 次成績的平均數(shù)都是 84,成績比較穩(wěn)定的是 (第二個空填“甲”或“乙” ) - 4 -思路:由莖葉圖可讀出,乙同學(xué)的成績?yōu)椋淄瑢W(xué)的成績?yōu)椋?9,80,82,88
8、,9181,82,83,84,91所以乙同學(xué)的成績的中位數(shù)為,相比較而言,甲同學(xué)的成績比較集中,所以比較穩(wěn)定的是82甲答案:,甲82小煉有話說:在求中位數(shù)時要注意先將數(shù)據(jù)從小到大排列,判斷成績穩(wěn)定,本題甲,乙穩(wěn)定性的判斷定量上要依靠方差,但因?yàn)楸绢}從莖葉圖上看出甲,乙數(shù)據(jù)穩(wěn)定性差距較大,所以定性的判斷。例 6:某校從參加高三年級期末考試的學(xué)生中隨機(jī)抽取 100 名學(xué)生,將其數(shù)學(xué)成績分成五段:,它的頻率分布直方圖如圖所示,則該批學(xué)50,70 , 70,90 , 90,110 , 110,130130,150生中成績不低于 90 分的人數(shù)是_思路:的高度未知,但由于直方圖體現(xiàn)的是全部樣本的情況,所
9、以各部分頻率和為90,1001,可以考慮間接法。從圖中可觀察到的頻率為,所50,900.00250.0150200.35以不低于 90 分的頻率為,故人數(shù)為(人)10.350.651000.6565答案: 65 - 5 -例 7:從某小區(qū)抽取 100 戶居民進(jìn)行月用電量調(diào)查,發(fā)現(xiàn)其用電量都在 50 到 350 度之間,頻率分布直方圖所示(1)直方圖中的值為_;x(2)在這些用戶中,用電量落在區(qū)間內(nèi)的戶數(shù)為_100,250思路:(1)依題意可得頻率直方圖中的頻率和等于 1,由圖可得組距為,所以有50,解得0.00240.00360.00600.00240.0012501x0.0044x (2)圖
10、中的頻率為,所以用戶數(shù)為100,2500.00360.0060.0044500.7(戶)1000.770答案:(1) (2)戶0.0044x 70例 7:某校 1000 名學(xué)生的數(shù)學(xué)測試成績分布直方圖如圖所示,分?jǐn)?shù)不低于即為優(yōu)秀,如果a優(yōu)秀的人數(shù)為 175 人,則的估計值是_a思路:可先從頻率直方圖中按分?jǐn)?shù)從高到低統(tǒng)計分?jǐn)?shù)段的人數(shù),組距為,從而可得:10的人數(shù)為,同理可得的人數(shù)為人,而優(yōu)140,15010000.01 10100130,140150秀的人數(shù)為人,所以應(yīng)包含的全體,以及中的一半人數(shù),所以估計175140,150130,140值為到的中間值,即130140135 - 6 -答案:
11、135a 例 8:某地區(qū)為了解中學(xué)生的日平均睡眠時間(單位:),隨機(jī)選擇了位中學(xué)生進(jìn)行調(diào)查,hn根據(jù)所得數(shù)據(jù),畫出樣本的頻率分布直方圖如圖所示,且從左到右的第 1 個、第 4 個、第 2 個、第 3 個小長方形的面積依次構(gòu)成公差為 0.1 的等差數(shù)列,又第一小組的頻數(shù)是 10,則 n _.思路:設(shè)第一個的面積為,則第 4 個為,第 2 個為,第 3 個1Sa40.1Sa20.2Sa為,依題意可得四部分的頻率和為 ,從而可解得,30.3Sa112341SSSS0.1a 所以,從而 10.1S 101000.1n 答案: 100例 9:某單位有職工 200 名,現(xiàn)要從中抽取 40 名職工作樣本,用
12、系統(tǒng)抽樣法,將全體職工隨機(jī)按 1200 編號,并按編號順序平均分為 40 組(15 號,610 號,196200 號).若第 5 組抽出的號碼為 22,則第 10 組抽出的號碼應(yīng)是_思路:由系統(tǒng)抽樣可知,每組抽出的號碼依次成等差數(shù)列,且公差為組距,所以5d ,則 522a 1055222547aad答案:47例 10:某單位有 840 名職工, 現(xiàn)采用系統(tǒng)抽樣抽取 42 人做問卷調(diào)查, 將 840 人按 1, 2, , 840 隨機(jī)編號, 則抽取的 42 人中, 編號落入?yún)^(qū)間的人數(shù)為 61,120思路:由系統(tǒng)抽樣可知:組距為,所以區(qū)間可拆分為840204261,120,而每個區(qū)間只有一人被抽取,所以共有 3 人61,80 , 81,100 , 101,120答案: 3