備戰(zhàn)2018年高考數(shù)學(xué) 糾錯筆記系列 專題11 統(tǒng)計 文
《備戰(zhàn)2018年高考數(shù)學(xué) 糾錯筆記系列 專題11 統(tǒng)計 文》由會員分享,可在線閱讀,更多相關(guān)《備戰(zhàn)2018年高考數(shù)學(xué) 糾錯筆記系列 專題11 統(tǒng)計 文(47頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 專題11 統(tǒng)計 易錯點(diǎn)1 不能正確區(qū)分總體、樣本、樣本容量 為了了解2016年參加市運(yùn)動會的240名運(yùn)動員的身高情況,從中抽取40名運(yùn)動員進(jìn)行測量.下列說法正確的是 A.總體是240名運(yùn)動員 B.個體是每一名運(yùn)動員 C.40名運(yùn)動員的身高是一個個體 D.樣本容量是40 【錯解】選擇A、B、C中的一個. 【錯因分析】對于選項A、B,對總體、個體、樣本的概念把握不準(zhǔn),誤將考察的對象當(dāng)作運(yùn)動員;對于選項C,把個體和樣本混淆致誤. 【試題解析】選D.根據(jù)統(tǒng)計的相關(guān)概念并結(jié)合題意可得,此題的總體、個體、樣本這三個概念的考察對象都是運(yùn)動員的身高,而不是運(yùn)動員,并且一個個體是指
2、一名運(yùn)動員的身高,選項A,B表達(dá)的對象都是運(yùn)動員,選項C未將個體和樣本理解透徹.在這個問題中,總體是240名運(yùn)動員的身高,個體是每名運(yùn)動員的身高,樣本是40名運(yùn)動員的身高,樣本容量是40.因此選D. 【參考答案】D. 1.明確相關(guān)概念 對總體、個體、樣本、樣本容量的概念要熟練把握,要明確總體與樣本的包含關(guān)系及樣本與樣本容量的區(qū)別,如本例選項C,是對概念把握不準(zhǔn). 2.注意考察對象 解決考查總體、個體、樣本、樣本容量的概念問題時,關(guān)鍵是明確考察對象,根據(jù)相關(guān)的概念可知總體、個體與樣本的考察對象是相同的,如本例中選項A,B表達(dá)的對象都是運(yùn)動員的身高而不是運(yùn)動員. 1.為了了解中
3、國好聲音第二季的56名學(xué)員的年齡情況,從中抽取14名學(xué)員進(jìn)行調(diào)查,則下列說法正確的是 A.總體是56 ???? B.個體是每一名學(xué)員 C.樣本是14名學(xué)員 ????? D.樣本容量是14 【答案】D 易錯點(diǎn)2 對隨機(jī)抽樣的概念理解不透徹 對于下列抽樣方法: ①運(yùn)動員從8個跑道中隨機(jī)抽取1個跑道;②從20個零件中一次性拿出3個來檢驗質(zhì)量;③某班50名學(xué)生,指定其中成績優(yōu)異的2名學(xué)生參加一次學(xué)科競賽;④為了保證食品安全,從某廠提供的一批月餅中,拿出一個檢查后放回,再拿一個檢查,反復(fù)5次,拿了5個月餅進(jìn)行檢查.其中,屬于簡單隨機(jī)抽樣的是_______.(把正確的序號都填上
4、) 【錯解】②③④ 【錯因分析】對簡單隨機(jī)抽樣的概念理解不透徹. 【試題解析】對于②,一次性拿出3個來檢驗質(zhì)量,違背簡單隨機(jī)抽樣特征中的“逐個”抽取;對于③,指定其中成績優(yōu)異的2名學(xué)生,不滿足等可能抽樣的要求;對于④,不滿足不放回抽樣的要求.故填①. 【參考答案】① 1.簡單隨機(jī)抽樣是不放回抽樣,抽樣過程中,每個個體被抽到的機(jī)會(概率)相等. 2.應(yīng)用簡單隨機(jī)抽樣應(yīng)注意的問題: (1)一個抽樣試驗?zāi)芊裼贸楹灧?,關(guān)鍵看兩點(diǎn): 一是抽簽是否方便; 二是號簽是否易攪勻. 一般地,當(dāng)總體容量和樣本容量都較小時可用抽簽法. (2)在使用隨機(jī)數(shù)表時,如遇到三位數(shù)或四位數(shù)時,可從
5、選擇的隨機(jī)數(shù)表中的某行某列的數(shù)字計起,每三個或四個作為一個單位,自左向右選取,有超過總體號碼或出現(xiàn)重復(fù)號碼的數(shù)字舍去. (3)簡單隨機(jī)抽樣需滿足: ①被抽取的樣本總體的個體數(shù)有限; ②逐個抽??; ③是不放回抽取; ④是等可能抽取. 2.從52名學(xué)生中選取5名學(xué)生參加全國“希望杯”數(shù)學(xué)競賽,若采用簡單隨機(jī)抽樣抽取,則每人入選的可能性 A.都相等,且為 B.都相等,且為 C.都相等,且為 D.都不相等 【答案】C 簡單隨機(jī)抽樣在抽樣過程中每一個個體被抽取的機(jī)會都相等(隨機(jī)抽樣的等可能性).若樣本容量為n,總體的個體數(shù)為N,則用簡單隨機(jī)抽樣時,每一個個體被抽到
6、的可能性都是,體現(xiàn)了這種抽樣方法的客觀性和公平性. 易錯點(diǎn)3 對系統(tǒng)抽樣的特點(diǎn)理解不到位 從2003名學(xué)生中抽取一個容量為40的樣本,應(yīng)如何抽取? 【錯解】將2003名學(xué)生按0001到2003編上號;將號碼隨機(jī)分成40份,每一份再用抽簽法隨機(jī)抽取一名學(xué)生,即得到了一個容量為40的樣本. 【錯因分析】由于2003不能被40整除,誤以為只能用簡單隨機(jī)抽樣進(jìn)行抽取,對兩種抽樣方法的特點(diǎn)理解不到位. 【試題解析】先將2003名學(xué)生按0001到2003編上號,利用隨機(jī)數(shù)表法從中剔除3名學(xué)生,再對剩余的2000名學(xué)生重新從0001到2000編號,按編號順序分成40組,每組50人
7、,先在第一組中用抽簽法抽出某一號,如0006,依次在其他組抽取0056,0106,…,1956,這樣就得到了一個容量為40的樣本. 【參考答案】見試題解析 1.當(dāng)總體容量較大,總體可以分為均勻的幾個部分時,用系統(tǒng)抽樣較為合理,但當(dāng)總體容量除以樣本容量不是整數(shù)時,要先在總體中剔除部分個體. 2.系統(tǒng)抽樣的操作步驟: 第一步編號:先將總體的N個個體編號; 第二步分段:確定分段間隔k,對編號進(jìn)行分段,當(dāng)(n是樣本容量)是整數(shù)時,取k=; 第三步確定首個個體:在第1段用簡單隨機(jī)抽樣確定第一個個體編號l(l≤k); 第四步獲取樣本:按照一定的規(guī)則抽取樣本,通常是將l加上間隔k得到第2個
8、個體編號,再加k得到第3個個體編號,依次進(jìn)行下去,直到獲取整個樣本. 系統(tǒng)抽樣是等距抽樣,用系統(tǒng)抽樣法抽取樣本,當(dāng)不為整數(shù)時,取,即先從總體中用簡單隨機(jī)抽樣的方法剔除(N-nk)個個體,且剔除多余的個體不影響抽樣的公平性. 3.某裝訂廠平均每小時大約裝訂圖書362冊,需要檢驗員每小時抽取40冊圖書檢驗其質(zhì)量狀況,請你設(shè)計一個抽樣方案. 【答案】抽樣方案見解析. 【解析】由于總體容量較大,樣本容量也較大,且個體間無明顯差異,所以采用系統(tǒng)抽樣的方法,步驟如下: 第一步,先從362冊圖書中剔除2冊圖書(剔除方法可用隨機(jī)數(shù)法); 第二步,將余下的360冊圖書編號為1,2,…,360
9、,并均勻分成40段,每段含k==9個個體; 第三步,從第1段即1,2,…,9這9個編號中,用簡單隨機(jī)抽樣的方法抽取一個編號(如6)作為起始號; 第四步,從6開始,再將編號為15,24, …,357的個體抽出,得到一個容量為40的樣本. 易錯點(diǎn)4 對個體的入樣可能性與抽樣間隔理解不透 中央電視臺動畫城節(jié)目為了對本周的熱心觀眾給予獎勵,要從2014名小觀眾中抽取50名幸運(yùn)小觀眾.先用簡單隨機(jī)抽樣從2014人中剔除14人,剩下的2000人再按系統(tǒng)抽樣方法抽取50人,則在2014人中,每個人被抽取的可能性 A.均不相等 B.不全相等 C.都相等,且為 D.都相等,且為 【錯解】選A
10、或D. 【錯因分析】對于選項A,誤認(rèn)為剔除14人,被抽取到的機(jī)會就不相等了,錯選A; 對于選項D,認(rèn)為被抽取的機(jī)會相等,但利用了剔除后的數(shù)據(jù)計算,錯選D. 【試題解析】選C.因為在系統(tǒng)抽樣中,若所給的總體個數(shù)不能被樣本容量整除,則應(yīng)先剔除幾個個體,本題先剔除14人,然后再分組,在剔除過程中,每個個體被剔除的機(jī)會相等.所以,每個個體被抽到的機(jī)會都相等,均為=. 【參考答案】C. 1.明確系統(tǒng)抽樣的操作要領(lǐng) 系統(tǒng)抽樣操作要領(lǐng)是先將個體數(shù)較多的總體分成均衡的若干部分,然后按照預(yù)先指定的規(guī)則,從每一部分中抽取一個個體,得到所需樣本.系統(tǒng)抽樣是等距離抽樣,每個個體被抽到的機(jī)會是相等的,如
11、本題中2000人要分為50段. 2.對系統(tǒng)抽樣合理分段 在系統(tǒng)抽樣過程中,為將整個編號分段,要確定分段間隔,當(dāng)在系統(tǒng)抽樣過程中比值不是整數(shù)時,要從總體中剔除一些個體(用簡單隨機(jī)抽樣),但每一個個體入樣的機(jī)會仍然相等.如本題中剔除14人后,每個人被抽取的可能性不變. 4.從72名志愿者中抽取10名志愿者進(jìn)行專業(yè)興趣調(diào)查,若采用系統(tǒng)抽樣,則每名志愿者被抽到的可能性是 A. B. C. D. 【答案】D 在系統(tǒng)抽樣中,總體的每個個體被剔除的機(jī)會是均等的,也就是每個個體不被剔除的機(jī)會也是均等的,由此可知在整個抽樣過程中每個個體被抽到的機(jī)會仍然相等. 若計算為:每名志愿
12、者被抽到的可能性為,則是錯誤的. 易錯點(diǎn)5 忽略分層抽樣的特點(diǎn) 某單位有老年人28人,中年人54人,青年人81人,為了調(diào)查他們的身體情況,需從中抽取一個容量為36的樣本,則適合的抽樣方法是 A.簡單隨機(jī)抽樣 B.系統(tǒng)抽樣 C.直接運(yùn)用分層抽樣 D.先從老年人中剔除1人,再用分層抽樣 【錯解】因為總體由差異明顯的三部分組成,所以考慮用分層抽樣.因為總?cè)藬?shù)為28+54+81=163,樣本容量為36,由于按抽樣,無法得到整數(shù)解,因此考慮先剔除1人,將抽樣比變?yōu)?若從老年人中隨機(jī)地剔除1人,則老年人應(yīng)抽取27×=6(人),中年人應(yīng)抽取54×=12(人),青年人應(yīng)抽取81×=18(人
13、),從而組成容量為36的樣本.故選D. 【錯因分析】如果用簡單隨機(jī)抽樣先從老年人中剔除1人的話,老年人被抽到的概率顯然比其他人群小了,這不符合隨機(jī)抽樣的特征——每個個體入樣的幾率相等.注意題干明確地說“先從老年人中剔除1人”,這和以前做的從總體中隨機(jī)剔除1人是不一樣的. 【試題解析】直接運(yùn)用分層抽樣,老年人、中年人和青年人中應(yīng)抽取的人數(shù)分別為×28≈6,×54≈12,×81≈18,故選C. 【方法點(diǎn)睛】分層抽樣的一個很重要的特點(diǎn)是每個個體被抽到的概率是一樣的.當(dāng)按照比例計算出的值不是整數(shù)時,一般是采用四舍五入的方法取值,若四舍五入后得到的樣本容量與要求的不盡相同,則可根據(jù)問題的實際意義適
14、當(dāng)處理,使之相同,這只是細(xì)節(jié)性問題,并未改變分層抽樣的本質(zhì). 【參考答案】C. 1.分層抽樣的前提和遵循的兩條原則 (1)前提:分層抽樣使用的前提是總體可以分層,層與層之間有明顯區(qū)別,而層內(nèi)個體間差異較小,每層中所抽取的個體數(shù)可按各層個體數(shù)在總體的個體數(shù)中所占比例抽取. (2)遵循的兩條原則: ①將相似的個體歸入一類,即為一層,分層要求每層的各個個體互不交叉,即遵循不重復(fù)、不遺漏的原則; ②分層抽樣為保證每個個體等可能入樣,需遵循在各層中進(jìn)行簡單隨機(jī)抽樣,每層樣本數(shù)量與每層個體數(shù)量的比等于抽樣比. 2.與分層抽樣有關(guān)問題的常見類型及解題策略: (1)求某一層的樣本數(shù)或總體
15、個數(shù).可依據(jù)題意求出抽樣比,再由某層總體個數(shù)(或樣本數(shù))確定該層的樣本(或總體)數(shù). (2)求各層的樣本數(shù).可依據(jù)題意,求出各層的抽樣比,再求出各層樣本數(shù). 進(jìn)行分層抽樣時應(yīng)注意以下幾點(diǎn): (1)分層抽樣中分多少層、如何分層要視具體情況而定,總的原則是層內(nèi)樣本的差異要小,兩層之間的樣本差異要大,且互不重疊. (2)為了保證每個個體等可能入樣,所有層中每個個體被抽到的可能性相同. (3)在每層抽樣時,應(yīng)采用簡單隨機(jī)抽樣或系統(tǒng)抽樣的方法進(jìn)行抽樣. 5.某電視臺在因特網(wǎng)上就觀眾對某一節(jié)目的喜愛程度進(jìn)行調(diào)查,參加調(diào)查的總?cè)藬?shù)為12000人,其中持各種態(tài)度的人數(shù)如下表所示: 很喜愛
16、 喜愛 一般 不喜愛 2435 4567 3926 1072 電視臺為了進(jìn)一步了解觀眾的具體想法和意見,打算從中再抽取60人進(jìn)行更為詳細(xì)的調(diào)查,應(yīng)怎樣進(jìn)行抽樣? 在分層抽樣中,確定抽樣比k是抽樣的關(guān)鍵.一般地,抽樣比k=(N為總體容量,n為樣本容量),再按抽樣比k 在各層中抽取個體,就能確保抽樣的公平性.在每層抽樣時,應(yīng)采用簡單隨機(jī)抽樣或系統(tǒng)抽樣的方法進(jìn)行. 易錯點(diǎn)6 誤將頻率分布直方圖的縱坐標(biāo)當(dāng)作頻率 中小學(xué)生的視力狀況受到社會的關(guān)注.某市有關(guān)部門從全市6萬名高一學(xué)生中隨機(jī)抽取400名學(xué)生,對他們的視力狀況進(jìn)行一次調(diào)查統(tǒng)計,將所得到的有關(guān)數(shù)據(jù)繪制成頻
17、率分布直方圖,如圖所示,從左至右五個小組的頻率之比為5∶7∶12∶10∶6,則該市6萬名高一學(xué)生中視力在[3.95,4.25)范圍內(nèi)的學(xué)生約有多少人? 【錯解】由圖可知,第五小組的頻率為0.5,所以第一小組的頻率為0.5×. 所以該市6萬名高一學(xué)生中視力在[3.95,4.25)范圍內(nèi)的學(xué)生約有60000×=25000(人). 【錯因分析】表面上看本題的回答似乎正確無誤,其實答案是錯誤的,其錯因在于沒有看懂所提供的頻率分布直方圖中的數(shù)據(jù)的含義,誤將該頻率分布直方圖中的縱坐標(biāo)(頻率與組距的比)看成了頻率,從而導(dǎo)致問題的解答出錯. 【試題解析】由圖可知,第五小組的頻率為0.5×0.3=
18、0.15, 所以第一小組的頻率為0.15×=0.125. 所以該市6萬名高一學(xué)生中視力在[3.95,4.25)范圍內(nèi)的學(xué)生約有60000×0.125=7500(人). 【參考答案】7500. 在數(shù)據(jù)的頻率分布直方圖中,縱坐標(biāo)表示的是頻率與組距的比, 每個小長方形的面積=組距×=頻率,將頻率與組距的比錯認(rèn)成頻率是初學(xué)者經(jīng)常犯的錯誤之一,解題過程中要引起足夠的重視. 1.畫頻率分布直方圖的步驟 (1)求極差(即一組數(shù)據(jù)中最大值與最小值的差); (2)決定組距與組數(shù); (3)將數(shù)據(jù)分組; (4)列頻率分布表; (5)畫頻率分布直方圖(以橫軸表示樣本分組,縱軸表示頻率與組距
19、的比值). 2.頻率分布直方圖的性質(zhì) (1)落在各小組內(nèi)的頻率用各小長方形的面積表示,且各小長方形的面積的和等于1. (2)頻率分布直方圖與眾數(shù)、中位數(shù)與平均數(shù)的關(guān)系 ①最高的小長方形中的某個(些)點(diǎn)的橫坐標(biāo)即是眾數(shù); ②中位數(shù)左邊和右邊的小長方形的面積和是相等的; ③平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積乘以小長方形底邊中點(diǎn)的橫坐標(biāo)之和. 繪制頻率分布直方圖的注意事項: (1)計算極差,需要找出這組數(shù)的最大值和最小值,當(dāng)數(shù)據(jù)很多時,可選一個數(shù)當(dāng)參照. (2)將一批數(shù)據(jù)分組,目的是要描述數(shù)據(jù)分布規(guī)律,要根據(jù)數(shù)據(jù)多少來確定分組數(shù)目,一般來說
20、,數(shù)據(jù)越多,分組越多. (3)將數(shù)據(jù)分組,決定分點(diǎn)時,一般使分點(diǎn)比數(shù)據(jù)多一位小數(shù),并且把第一組的起點(diǎn)稍微減小一點(diǎn). (4)列頻率分布表時,可通過逐一判斷各個數(shù)據(jù)落在哪個小組內(nèi),以“正”字確定各個小組內(nèi)數(shù)據(jù)的個數(shù). (5)畫頻率分布直方圖時,縱坐標(biāo)表示頻率與組距的比值,一定不能標(biāo)成頻率. 6.為了解今年某校高三畢業(yè)班準(zhǔn)備報考飛行員學(xué)生的體重(單位:千克)情況,將所得的數(shù)據(jù)整理后,畫出了頻率分布直方圖,如圖所示,已知圖中從左到右的前三個小組的頻率之比為,其中第2小組的頻數(shù)為12,則該校報考飛行員的總?cè)藬?shù)為________. 【答案】48 頻率分布直方圖是用樣本估計總體的
21、一種重要方法,是高考命題的一個熱點(diǎn),多以選擇題或填空題的形式呈現(xiàn),試題難度不大,多為容易題或中檔題,且主要有以下幾個命題角度: (1)已知頻率分布直方圖中的部分?jǐn)?shù)據(jù),求其他數(shù)據(jù).可根據(jù)頻率分布直方圖中的數(shù)據(jù)求出樣本與總體的關(guān)系,利用頻率和等于1就可求出其他數(shù)據(jù). (2)已知頻率分布直方圖,求某種范圍內(nèi)的數(shù)據(jù).可利用圖形及某范圍結(jié)合求解. (3)與概率有關(guān)的綜合問題,可先求出頻率,再利用古典概型等知識求解. 易錯點(diǎn)7 對莖葉圖的畫法規(guī)則認(rèn)識不夠 某市對上下班情況作了抽樣調(diào)查,上下班時間各抽測了12輛機(jī)動車的車速如下(單位:km/h): 上班時間:30,33,18,27,32,
22、40,26,28,21,28,35,20; 下班時間:27,19,32,29,36,29,30,22,25,16,17,30.用莖葉圖表示以上數(shù)據(jù). 【錯解】機(jī)動車行駛速度的莖葉圖如圖所示. 【錯因分析】莖葉圖對于重復(fù)出現(xiàn)的數(shù)據(jù)要重復(fù)記錄. 【試題解析】機(jī)動車行駛速度的莖葉圖如圖. 【方法點(diǎn)睛】畫莖葉圖需要注意,將每個數(shù)據(jù)分為莖和葉兩部分,將表示莖的數(shù)字按照大小順序由上到下排列,在寫每行葉子的時候,重復(fù)出現(xiàn)的數(shù)字應(yīng)該按原次數(shù)寫入葉子部位,不能只按一次寫入. 【參考答案】見試題解析. 1.莖葉圖將所有兩位數(shù)的十位數(shù)字作為莖,個位數(shù)字作為葉,莖相同者共用一個莖,莖按從小到
23、大的順序從上向下列出,共莖的葉可以按從大到小(或從小到大)的順序同行列出(也可以沒有大小順序). 2.繪制莖葉圖的關(guān)鍵是分清莖和葉.一般地說,當(dāng)數(shù)據(jù)是兩位數(shù)時,十位上的數(shù)字為“莖”,個位上的數(shù)字為“葉”;如果是小數(shù),通常把整數(shù)部分作為“莖”,小數(shù)部分作為“葉”.解題時要根據(jù)數(shù)據(jù)的特點(diǎn)合理地選擇莖和葉. 3.應(yīng)用莖葉圖對兩組數(shù)據(jù)進(jìn)行比較時,要從數(shù)據(jù)分布的對稱性、中位數(shù)、穩(wěn)定性等幾方面來比較. 4.莖葉圖只適用于樣本數(shù)據(jù)較少的情況. 在樣本數(shù)據(jù)較少時,用莖葉圖表示數(shù)據(jù)的效果較好.它不但可以保留所有信息,而且可以隨時記錄,這對數(shù)據(jù)的記錄和表示都能帶來方便.但是當(dāng)樣本數(shù)據(jù)較多時,莖葉圖就顯
24、得不太方便,因為每一個數(shù)據(jù)都要在圖中占據(jù)一個空間,如果數(shù)據(jù)很多,枝葉就會很長. 7.甲、乙兩位學(xué)生參加數(shù)學(xué)競賽培訓(xùn),在培訓(xùn)期間他們參加的5次預(yù)賽成績記錄如下: 甲:82,82,79,95,87 乙:95,75,80,90,85 (1)用莖葉圖表示這兩組數(shù)據(jù); (2)求甲、乙兩人成績的平均數(shù)與方差; (3)若現(xiàn)要從中選派一人參加數(shù)學(xué)競賽,你認(rèn)為選派哪位學(xué)生參加合適,說明理由? 【答案】(1)見解析;(2)甲的成績的平均數(shù)為85,方差為31.6,乙的成績的平均數(shù)為85,方差為50;(3)派甲參賽比較合理,理由見解析. 【解析】(1)以十位數(shù)字為莖,個位數(shù)字為葉,作出莖葉圖如圖所
25、示: (3)派甲參賽比較合理. 理由是甲,乙的平均分一樣,證明平均成績一樣,而甲的方差小于乙的方差,則證明甲的成績更穩(wěn)定. 易錯點(diǎn)8 忽略方差的統(tǒng)計意義 甲、乙兩種冬小麥實驗品種連續(xù)5年的平均單位面積產(chǎn)量如下(單位:t /km2): 品種 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 若某村要從中引進(jìn)一種冬小麥大量種植,給出你的建議. 【錯解】由題意得(9.8+9.9+10.1+10+10.2)=10, (9.4+10.3+10.8+9.7+
26、9.8)=10, 甲、乙兩種冬小麥的平均產(chǎn)量都等于10,所以引進(jìn)兩種冬小麥的任意一種都可以. 【錯因分析】上述錯誤在于只對兩種冬小麥的平均產(chǎn)量做了比較,而忽略了對冬小麥產(chǎn)量穩(wěn)定性的討論. 【試題解析】由題意得(9.8+9.9+10.1+10+10.2)=10, (9.4+10.3+10.8+9.7+9.8)=10, ×[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02, ×[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244, 甲、乙兩種冬小麥的平均產(chǎn)
27、量都等于10,且, 所以產(chǎn)量比較穩(wěn)定的為甲種冬小麥,推薦引進(jìn)甲種冬小麥大量種植. 【方法點(diǎn)睛】平均數(shù)反映的是樣本個體的平均水平,方差和標(biāo)準(zhǔn)差則反映了樣本的波動、離散程度.對于形如“誰發(fā)揮更好、誰更穩(wěn)定、誰更優(yōu)秀”之類的題目,除比較數(shù)據(jù)的平均值外,還應(yīng)該比較方差或標(biāo)準(zhǔn)差的大小,以作出更為公正、合理的判斷. 【參考答案】推薦引進(jìn)甲種冬小麥大量種植. 用樣本估計總體時,樣本的平均數(shù)、標(biāo)準(zhǔn)差只是總體的平均數(shù)、標(biāo)準(zhǔn)差的近似.實際應(yīng)用中,當(dāng)所得數(shù)據(jù)的平均數(shù)不相等時,需先分析平均水平,再計算標(biāo)準(zhǔn)差(方差)分析穩(wěn)定情況. 1.平均數(shù)與方差都是重要的數(shù)字特征,是對總體的一種簡明的描述. 2
28、.眾數(shù)、中位數(shù)與平均數(shù)都是描述一組數(shù)據(jù)集中趨勢的量,平均數(shù)是最重要的量.平均數(shù)反映的是樣本個體的平均水平,眾數(shù)和中位數(shù)則反映樣本中個體的“重心”. 3.?dāng)?shù)據(jù)的離散程度可以通過極差、方差或標(biāo)準(zhǔn)差來描述,極差反映了一組數(shù)據(jù)變化的最大幅度,它對一組數(shù)據(jù)中的極端值極為敏感.一般情況下,極差大,則數(shù)據(jù)波動性大;極差小,則數(shù)據(jù)波動性小.極差只需考慮兩個極端值,便于計算,但沒有考慮中間的數(shù)據(jù),可靠性較差.方差和標(biāo)準(zhǔn)差反映了數(shù)據(jù)波動程度的大?。畼?biāo)準(zhǔn)差、方差越大,數(shù)據(jù)的離散程度越大,越波動;標(biāo)準(zhǔn)差、方差越小,數(shù)據(jù)的離散程度越小,越穩(wěn)定. 8.3月是植樹造林的最佳季節(jié),某公園打算在3.12植樹節(jié)前后引種一
29、批名優(yōu)樹種.現(xiàn)有甲、乙兩家苗木場各送來一批同種樹苗,該公園園林部從中分別抽取100棵測量其高度,得到如下頻率分布表: 高度(cm) [60,70) [70,80) [80,90) [90,100] 頻率 甲苗木場 0.18 0.24 0.26 0.32 乙苗木場 0.20 0.30 0.30 0.20 (1)分別算出甲、乙兩家苗木場樹苗樣本高度的平均值,; (2)根據(jù)樣本數(shù)據(jù)可算得兩個方差:=120.16,=105.0,結(jié)合(1)中算出的數(shù)據(jù),如果你是該公園園林部主管,你將選擇哪家苗木場的樹苗?說明你的觀點(diǎn). 【答案】(1);(2)見解析. (2)
30、觀點(diǎn)一:選擇乙場的樹苗,因為其提供的樹苗高度方差較小,成長較整齊,種在公園里比較好看. 觀點(diǎn)二:選擇甲場的樹苗,因為其提供的樹苗平均高度較大,說明長勢較好,且方差較大,種在公園里顯得高矮錯落有致,更能體現(xiàn)空間美感. (注:兩種觀點(diǎn)寫一種即可) 一組數(shù)據(jù)的平均數(shù)、中位數(shù)都是唯一的,眾數(shù)不唯一,可以有一個,也可以有多個,還可以沒有.如果有兩個數(shù)據(jù)出現(xiàn)的次數(shù)相同,并且比其他數(shù)據(jù)出現(xiàn)的次數(shù)都多,那么這兩個數(shù)據(jù)都是這組數(shù)據(jù)的眾數(shù). 易錯點(diǎn)9 運(yùn)用數(shù)字特征作評價時考慮不周 一次數(shù)學(xué)知識競賽中,兩組學(xué)生成績?nèi)缦? 分?jǐn)?shù) 50 60 70 80 90 100 人數(shù) 甲組
31、 2 5 10 13 14 6 乙組 4 4 16 2 12 12 經(jīng)計算,已知兩個組的平均分都是80分,請根據(jù)所學(xué)過的統(tǒng)計知識,進(jìn)一步判斷這次競賽中哪個組更優(yōu)秀,并說明理由. 【錯解】由于乙組90分以上的人數(shù)比甲組90分以上的人數(shù)多,所以乙組更優(yōu)秀. 【錯因分析】對一組數(shù)據(jù)進(jìn)行分析的時候,應(yīng)從平均數(shù)、眾數(shù)、中位數(shù)、方差、極差等多個角度進(jìn)行判斷. 【試題解析】(1)甲組成績的眾數(shù)為90分,乙組成績的眾數(shù)為70分,從成績的眾數(shù)這一角度看,甲組成績好些. (2)×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(
32、90-80)2+6×(100-80)2]=172. 同理=256. 因為,所以甲組的成績比乙組的成績穩(wěn)定. (3)甲、乙兩組成績的中位數(shù)、平均數(shù)都是80分,其中甲組成績在80分以上(含80分)的有33人,乙組成績在80分以上(含80分)的有26人,從這一角度看,甲組成績總體較好. (4)從成績統(tǒng)計表看,甲組成績大于或等于90分的有20人,乙組成績大于或等于90分的有24人,所以乙組成績在高分段的人數(shù)多.同時,乙組滿分比甲組多6人,從這一角度看,乙組成績較好. 【參考答案】見解析. 1.平均數(shù)受個別極端數(shù)據(jù)(比其他數(shù)據(jù)大很多或小很多的數(shù)據(jù))的影響較大,因此若在數(shù)據(jù)中存在少量極端
33、數(shù)據(jù)時,平均數(shù)對總體估計的可靠性較差,往往用眾數(shù)或中位數(shù)去估計總體.有時也采用剔除最大值與最小值后所得的平均數(shù)去估計總體. 2.運(yùn)用數(shù)字特征進(jìn)行評價時,要全面考慮各數(shù)字特征的優(yōu)缺點(diǎn),從不同層面或兩兩綜合進(jìn)行評價,才能得到較為可靠的估計. 9.小明是班里的優(yōu)秀學(xué)生,他的歷次數(shù)學(xué)成績是96,98,95,93分,但最近的一次考試成績只有45分,原因是他帶病參加了考試.期末評價時,怎樣給小明評價? 【答案】優(yōu)秀. 這5次數(shù)學(xué)考試的平均分是=85.4,則按平均分給小明的評價是“良好”. 這種評價是不合理的,盡管平均分是反映一組數(shù)據(jù)平均水平的重要特征,但任何一個數(shù)據(jù)的改變都會引起它
34、的變化,而中位數(shù)則不受某些極端值的影響. 本題中的5個成績從小到大排列為:45,93,95,96,98,中位數(shù)是95,較為合理地反映了小明的數(shù)學(xué)水平,因而應(yīng)該用中位數(shù)來衡量小明的數(shù)學(xué)成績. 易錯點(diǎn)10 弄錯回歸方程中,的位置 某班5名學(xué)生的數(shù)學(xué)和物理成績?nèi)缦卤恚? (1)畫出散點(diǎn)圖. (2)求物理成績y對數(shù)學(xué)成績x的線性回歸方程. 【錯解】(1)散點(diǎn)圖如圖所示: (2)計算得,, , , 所以,. 所以y對x的線性回歸方程是. 【錯因分析】錯解中回歸方程記憶錯誤,應(yīng)為. 【試題解析】(1)散點(diǎn)圖如圖所示: (2)計算得,, , , 所以,.
35、所以y對x的線性回歸方程是. 【參考答案】. 由回歸直線方程得到的預(yù)報值不是預(yù)報變量的精確值,事實上,它是預(yù)報變量的可能取值的平均值. 1.求回歸直線方程的一般步驟: (1)作出散點(diǎn)圖,依據(jù)問題所給的數(shù)據(jù)在平面直角坐標(biāo)系中描點(diǎn),觀察點(diǎn)的分布是否呈條狀分布,即是否在一條直線附近,從而判斷兩變量是否具有線性相關(guān)關(guān)系. (2)當(dāng)兩變量具有線性相關(guān)關(guān)系時,求回歸系數(shù),寫出回歸直線方程. (3)根據(jù)方程進(jìn)行估計. 2.不要受前面學(xué)習(xí)的直線方程的影響,而將回歸方程寫為,實際上,回歸方程應(yīng)為. 10.某地區(qū)2008年至2016年糧食產(chǎn)量的部分?jǐn)?shù)據(jù)如下表: (1)求該地區(qū)2
36、008年至2016年的糧食年產(chǎn)量與年份之間的線性回歸方程; (2)利用(1)中的回歸方程,分析2008年至2016年該地區(qū)糧食產(chǎn)量的變化情況,并預(yù)測該地區(qū) 2018年的糧食產(chǎn)量. 附:回歸直線的斜率和截距的最小二乘估計公式分別為. 【答案】(1);(2)299. 2萬噸. (2)由(1)知,,故2008年至2016年該地區(qū)糧食產(chǎn)量逐年增加,平均每兩年增加6. 5 萬噸. 將代入(1)中的線性回歸方程,得, 故預(yù)測該地區(qū)2018 年的糧食產(chǎn)量為299. 2萬噸. 回歸系數(shù)的含義是: (1)代表x每增加一個單位,y的平均增加單位數(shù),而不是增加單位數(shù). (2)當(dāng)>0時,兩個
37、變量呈正相關(guān)關(guān)系,含義為:x每增加一個單位,y平均增加個單位數(shù); 當(dāng)<0時,兩個變量呈負(fù)相關(guān)關(guān)系,含義為:x每增加一個單位,y平均減少個單位數(shù). 易錯點(diǎn)11 忽略求回歸方程的前提——線性相關(guān) 假設(shè)某設(shè)備的使用年限和所支出的維修費(fèi)用如下表中統(tǒng)計資料所示: 使用年限x(年) 1 2 3 4 5 6 維修費(fèi)用y(萬元) 5.0 0.8 0.5 6.5 7.0 1.2 能否用線性回歸模型描述兩個變量間的關(guān)系? 【錯解】求出相關(guān)的數(shù)據(jù)直接代入公式求得=0.16,=2.94, 則線性回歸方程為=0.16x+2.94. 故可以用線性回歸模型描述兩個變量之間的關(guān)
38、系. 【錯因分析】沒有先判斷兩個變量是否具有線性相關(guān)關(guān)系. 【試題解析】畫出散點(diǎn)圖,如圖所示, 從散點(diǎn)圖上看,這些點(diǎn)的分布幾乎沒有什么規(guī)則,故不能用線性回歸模型描述兩個變量之間的關(guān)系. 【參考答案】不能用線性回歸模型描述兩個變量之間的關(guān)系. 相關(guān)關(guān)系與函數(shù)關(guān)系的異同點(diǎn): 共同點(diǎn):二者都是指兩個變量間的關(guān)系. 不同點(diǎn):函數(shù)關(guān)系是一種確定性關(guān)系,體現(xiàn)的是因果關(guān)系;而相關(guān)關(guān)系是一種非確定性關(guān)系,體現(xiàn)的不一定是因果關(guān)系,可能是伴隨關(guān)系. 1.兩個變量x與y相關(guān)關(guān)系的判斷方法: (1)散點(diǎn)圖法:通過散點(diǎn)圖,觀察它們的分布是否存在一定規(guī)律,直觀地判斷;如果發(fā)現(xiàn)點(diǎn)的分布從整體
39、上看大致在一條直線附近,那么這兩個變量就是線性相關(guān)的,注意不要受個別點(diǎn)的位置的影響. (2)表格、關(guān)系式法:結(jié)合表格或關(guān)系式進(jìn)行判斷; (3)經(jīng)驗法:借助積累的經(jīng)驗進(jìn)行分析判斷. 2.求線性回歸方程時,先利用散點(diǎn)圖判斷兩個變量是否存在線性相關(guān)關(guān)系,只有在兩個變量之間存在線性相關(guān)關(guān)系時,求出的線性回歸方程才有意義.否則,如果兩個變量之間不存在線性相關(guān)關(guān)系,即使由樣本數(shù)據(jù)求出回歸方程,用其估計和預(yù)測的結(jié)果也是不可信的. 11.在一次抽樣調(diào)查中測得樣本的5個樣本點(diǎn)數(shù)值如下表: x 0.25 0.5 1 2 4 y 16 12 5 2 1 試建立y與x之間的回歸方
40、程. 【答案】. 【解析】由數(shù)值表可作散點(diǎn)圖如圖所示: 根據(jù)散點(diǎn)圖可知y與x近似地呈反比例函數(shù)關(guān)系,設(shè)y=,令t=,則y=kt,原數(shù)據(jù)變?yōu)椋? t 4 2 1 0.5 0.25 y 16 12 5 2 1 由置換后的數(shù)值表作散點(diǎn)如圖所示: 由散點(diǎn)圖可以看出y與t呈近似的線性相關(guān)關(guān)系.列表如下: i ti yi tiyi 1 4 16 64 16 256 2 2 12 24 4 144 3 1 5 5 1 25 4 0.5 2 1 0.25 4 5 0.25 1 0.25 0.062
41、5 1 ∑ 7.75 36 94.25 21.3125 430 所以=1.55,=7.2, 所以,, 所以. 所以y與x的回歸方程是. 若兩變量間的關(guān)系不是線性相關(guān)關(guān)系,應(yīng)觀察分析其散點(diǎn)圖,找出擬合函數(shù),通過變量代換再作線性回歸.如果本題直接如下求解: ∵==1.55,==7.2, =0.25×16+0.5×12+1×5+2×2+4×1=23, =0.252+0.52+12+22+42=21.3125,=162+122+52+22+12=430. ∴. ,∴=12.67-3.53x. 這種解法是錯誤的,原因是這兩個變量之間不是線性相關(guān)關(guān)系.此類問題的解決
42、,應(yīng)先對兩個變量間的相關(guān)關(guān)系進(jìn)行相關(guān)性檢驗,然后結(jié)合作出的散點(diǎn)圖,選擇適宜的回歸方程. 易錯點(diǎn)12 沒有準(zhǔn)確掌握公式中參數(shù)的含義 有甲、乙兩個班級進(jìn)行一門考試,按照學(xué)生考試成績優(yōu)秀和不優(yōu)秀統(tǒng)計后,得到如下的列聯(lián)表: 班級與成績列聯(lián)表: 優(yōu)秀 不優(yōu)秀 總計 甲班 10 35 45 乙班 7 38 45 總計 17 73 90 試問能有多大把握認(rèn)為“成績與班級有關(guān)系”? 參考公式及數(shù)據(jù):,其中. 0.05 0.01 0.005 0.001 3.841 6.635 7.879 10.828 【錯解】計算得的觀測值為, 因為5
43、6.86>6.635,所以有99%的把握認(rèn)為“成績與班級有關(guān)系”. 【錯因分析】由于對2×2列聯(lián)表中a、b、c、d的位置不清楚,在代入公式時代錯了數(shù)值導(dǎo)致計算結(jié)果的錯誤. 【試題解析】計算得的觀測值為, 因為0.653<3.841,所以沒有充分證據(jù)認(rèn)為“成績與班級有關(guān)系”. 【參考答案】沒有充分證據(jù)認(rèn)為“成績與班級有關(guān)系”. 獨(dú)立性檢驗中,參數(shù)K2的公式復(fù)雜,計算量大,要弄清公式的特點(diǎn),熟記公式,小心計算,避免粗心致誤. 解決一般的獨(dú)立性檢驗問題,首先由題目所給的2×2列聯(lián)表確定a,b,c,d,n的值,然后代入隨機(jī)變量的計算公式求出觀測值k,將k與臨界值k0進(jìn)行對比,確定
44、有多大的把握認(rèn)為“兩個分類變量有關(guān)系”. 列聯(lián)表中的數(shù)據(jù)是樣本數(shù)據(jù),它只是總體的代表,具有隨機(jī)性,因此,需要用獨(dú)立性檢驗的方法確認(rèn)所得結(jié)論在多大程度上適用于總體.即獨(dú)立性檢驗得出的結(jié)論是帶有概率性質(zhì)的,只能說結(jié)論成立的概率有多大,而不能完全肯定一個結(jié)論,因此才出現(xiàn)了臨界值表,在分析問題時一定要注意這點(diǎn),不可對某個問題下確定性結(jié)論,否則就可能對統(tǒng)計計算的結(jié)果作出錯誤的解釋. 12.中國神舟十一號載人飛船在酒泉衛(wèi)星發(fā)射中心成功發(fā)射,引起全國轟動.開學(xué)后,某校高二年級班主任對該班進(jìn)行了一次調(diào)查,發(fā)現(xiàn)全班60名同學(xué)中,對此事關(guān)注的占,他們在本學(xué)期期末考試中的物理成績(滿分100分)如下面的
45、頻率分布直方圖: (1)求“對此事關(guān)注”的同學(xué)的物理成績的平均分(以各區(qū)間的中點(diǎn)代表該區(qū)間的均值). (2)若物理成績不低于80分的為優(yōu)秀,請以是否優(yōu)秀為分類變量, ①補(bǔ)充下面的列聯(lián)表: 物理成績優(yōu)秀 物理成績不優(yōu)秀 總計 對此事關(guān)注 對此事不關(guān)注 總計 ②是否有以上的把握認(rèn)為“對此事是否關(guān)注”與“物理成績是否優(yōu)秀”有關(guān)系? 參考公式及數(shù)據(jù):,其中. 0.15 0.10 0.05 0.025 0.010 0.005 0.001 2.072 2.706 3.841 5.024 6.635 7.87
46、9 10.828 【答案】(1)(分);(2)①見解析;②沒有以上的把握認(rèn)為“對此事是否關(guān)注”與“物理成績是否優(yōu)秀”有關(guān)系. 【解析】(1) “對此事關(guān)注”的同學(xué)的物理成績的平均分為 6595(分). (2)①補(bǔ)充完整的列聯(lián)表如下: 物理成績優(yōu)秀 物理成績不優(yōu)秀 總計 對此事關(guān)注 8 12 20 對此事不關(guān)注 8 32 40 總計 16 44 60 ②由①中的列聯(lián)表可得的觀測值為, 所以沒有以上的把握認(rèn)為“對此事是否關(guān)注”與“物理成績是否優(yōu)秀”有關(guān)系. 一、三種抽樣方法 1.三種抽樣方法的比較 類別 共同點(diǎn) 各自特點(diǎn) 相互聯(lián)系
47、適用范圍 簡單隨 機(jī)抽樣 是不放回抽樣,抽樣過程中,每個個體被抽到的機(jī)會(概率)相等 從總體中逐個抽取 — 總體中的個數(shù)較少 系統(tǒng)抽樣 將總體均分成幾部分,按事先確定的規(guī)則,在各部分抽取 在起始部分抽樣時,采用簡單隨機(jī)抽樣 總體中的個數(shù)比較多 分層抽樣 將總體分成幾層,分層進(jìn)行抽取 各層抽樣時,采用簡單隨機(jī)抽樣或者系統(tǒng)抽樣 總體由差異明顯的幾部分組成 2.抽樣方法的選取方法 (1)若總體由差異明顯的幾個層次組成,則選用分層抽樣. (2)若總體沒有差異明顯的層次,則考慮采用簡單隨機(jī)抽樣或系統(tǒng)抽樣. 當(dāng)總體容量較小時宜用抽簽法;當(dāng)總體容量較大,樣本容量較小時宜用
48、隨機(jī)數(shù)表法;當(dāng)總體容量較大,樣本容量也較大時宜用系統(tǒng)抽樣. 利用系統(tǒng)抽樣的兩個關(guān)鍵步驟: (1)分組,當(dāng)總體個數(shù)N能被樣本容量n整除時,分為n個組,分段間隔k=; (2)獲取樣本用簡單隨機(jī)抽樣在第一組抽取起始數(shù)s,通常把起始數(shù)s加上間隔k得到第2個個體編號(s+k),再加上k得第3個個體編號(s+2k),依次進(jìn)行下去,直到獲取樣本. 二、用樣本估計總體 1.?dāng)?shù)字特征 (1)眾數(shù)、中位數(shù)、平均數(shù) 數(shù)字特征 定義 與頻率分布直方圖的關(guān)系 眾數(shù) 出現(xiàn)次數(shù)最多的數(shù)據(jù) 最高的小長方形中的某個(些)點(diǎn)的橫坐標(biāo) 中位數(shù) 將數(shù)據(jù)按大小依次排列,處在最中間位置的一個數(shù)據(jù)(或最中間
49、兩個數(shù)據(jù)的平均數(shù)) 中位數(shù)左邊和右邊的小長方形的面積和是相等的 平均數(shù) 樣本數(shù)據(jù)的算術(shù)平均數(shù) 每個小矩形的面積乘以小矩形底邊中點(diǎn)的橫坐標(biāo)之和 (2)極差、方差和標(biāo)準(zhǔn)差 極差:即一組數(shù)據(jù)中最大值與最小值的差. 方差:. 標(biāo)準(zhǔn)差:. (3)性質(zhì) ①若的平均數(shù)為,那么的平均數(shù)為. ②數(shù)據(jù)與數(shù)據(jù)的方差相等,即數(shù)據(jù)經(jīng)過平移后方差不變. ③若的方差為s2,那么的方差為. 2.統(tǒng)計表 (1)頻率分布的估計:頻率分布是指各個小組數(shù)據(jù)在樣本中所占比例的大小,可以用樣本的頻率分布估計總體的頻率分布,頻率分布表是反映樣本的頻率分布的表格.通過頻率分布直方圖和頻率分布表可以看到樣本的頻率分
50、布. (2)盡管有些總體密度曲線是客觀存在的,但是在實際應(yīng)用中我們并不知道它的具體表達(dá)形式,需要用樣本來估計.由于樣本是隨機(jī)的,不同的樣本得到的頻率分布折線圖不同;即使對于同一個樣本,不同的分組情況得到的頻率分布折線圖也不同.頻率分布折線圖是隨樣本容量和分組情況的變化而變化的,因此不能用樣本的頻率分布折線圖得到準(zhǔn)確的總體密度曲線. (3)估計總體分布的步驟是: ①選擇適當(dāng)?shù)某闃臃椒◤目傮w中抽取樣本,即收集數(shù)據(jù). ②利用樣本數(shù)據(jù)畫出統(tǒng)計圖或計算數(shù)字特征. ③結(jié)合統(tǒng)計圖分析樣本取值的分布規(guī)律. ④用樣本取值的分布規(guī)律估計總體分布,由于是用科學(xué)抽樣抽取的樣本,那么樣本與總體取值的分布規(guī)律
51、近似,有時也可看成相同. ⑤利用總體分布解決有關(guān)問題. (4)各種統(tǒng)計表的優(yōu)點(diǎn)與不足 優(yōu)點(diǎn) 不足 頻率分布表 表示數(shù)據(jù)較確切 分析數(shù)據(jù)分布的總體態(tài)勢不方便 頻率分布直方圖 表示數(shù)據(jù)分布情況非常直觀 原有的具體數(shù)據(jù)信息被抹掉了 頻率分布折線圖 能反映數(shù)據(jù)的變化趨勢 不能顯示原有數(shù)據(jù) 莖葉圖 一是所有的信息都可以從這個莖葉圖中得到;二是莖葉圖便于記錄和表示,能夠展示數(shù)據(jù)的分布情況 樣本數(shù)據(jù)較多或數(shù)據(jù)位數(shù)較多時,不方便表示數(shù)據(jù) 頻率分布表、頻率分布直方圖、頻率分布折線圖、總體密度曲線都是描述樣本數(shù)據(jù)分布情況,估計總體頻率分布規(guī)律的,其聯(lián)系如下:
52、三、變量間的相關(guān)關(guān)系 1.相關(guān)關(guān)系 當(dāng)自變量取值一定時,因變量的取值帶有一定的隨機(jī)性,則這兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.即相關(guān)關(guān)系是一種非確定性關(guān)系. 當(dāng)一個變量的值由小變大時,另一個變量的值也由小變大,則這兩個變量正相關(guān); 當(dāng)一個變量的值由小變大時,而另一個變量的值由大變小,則這兩個變量負(fù)相關(guān). 2.散點(diǎn)圖 將樣本中的n個數(shù)據(jù)點(diǎn)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖. 從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關(guān)關(guān)系稱為正相關(guān),點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),兩個變量的相關(guān)關(guān)系為負(fù)相關(guān). 具有正相關(guān)關(guān)系的兩個變量的散點(diǎn)圖如圖1,具有負(fù)相關(guān)關(guān)系的
53、兩個變量的散點(diǎn)圖如圖2. 3.回歸分析 如果散點(diǎn)圖中點(diǎn)的分布從整體上看大致在一條直線附近,則這兩個變量之間具有線性相關(guān)關(guān)系,這條直線叫做回歸直線. 回歸直線對應(yīng)的方程叫做回歸直線方程(簡稱回歸方程). 4.回歸方程的求解 (1)求回歸方程的方法是最小二乘法,即使得樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離的平方和最小. 若變量x與y具有線性相關(guān)關(guān)系,有n個樣本數(shù)據(jù),則回歸方程中,. 其中,稱為樣本點(diǎn)的中心. (2)線性回歸模型,其中稱為隨機(jī)誤差,自變量稱為解釋變量,因變量稱為預(yù)報變量. ①回歸直線必過樣本點(diǎn)的中心,這個結(jié)論既是檢驗所求回歸直線方程是否準(zhǔn)確的依據(jù),也是求參數(shù)的一個依據(jù).
54、 ②利用回歸直線方程不但可以預(yù)測在x取某一個值時,y的估計值,同時也能知道x每增加1個單位,的變化量. ③在回歸直線方程中,既表示直線的斜率,又表示自變量x的取值每增加一個單位時,函數(shù)y的改變量. 5.相關(guān)系數(shù) (1)樣本相關(guān)系數(shù)r的計算公式 我們可以利用相關(guān)系數(shù)來定量地衡量兩個變量之間的線性相關(guān)關(guān)系,計算公式為. (2)樣本相關(guān)系數(shù)r的性質(zhì) ①; ②當(dāng)r>0時,表明兩個變量正相關(guān);當(dāng)r<0時,表明兩個變量負(fù)相關(guān); ③|r|越接近于1,表明兩個變量的線性相關(guān)性越強(qiáng); ④|r|越接近于0,表明兩個變量的線性相關(guān)性越弱. 6.非線性回歸分析 對某些特殊的非線性關(guān)系,可以通過變
55、量轉(zhuǎn)換,把非線性回歸問題轉(zhuǎn)化成線性回歸問題,然后用線性回歸的方法進(jìn)行研究. 在大量的實際問題中,所研究的兩個變量不一定都呈線性相關(guān)關(guān)系,當(dāng)兩變量y與x不具有線性相關(guān)關(guān)系時,要借助散點(diǎn)圖,與已學(xué)過的函數(shù)(如指數(shù)函數(shù)、對數(shù)函數(shù)、冪函數(shù)等)的圖象相比較,找到合適的函數(shù)模型,利用變量代換轉(zhuǎn)化為線性函數(shù)關(guān)系,從而使問題得以解決. 求非線性回歸方程的步驟: ①確定變量,作出散點(diǎn)圖. ②根據(jù)散點(diǎn)圖,選擇恰當(dāng)?shù)臄M合函數(shù). ③變量置換,通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題,并求出線性回歸方程. ④分析擬合效果:通過計算相關(guān)指數(shù)或畫殘差圖來判斷擬合效果. ⑤根據(jù)相應(yīng)的變換,寫出非線性回
56、歸方程. 7.刻畫回歸效果的方式 方式方法 計算公式 刻畫效果 越接近于1,表示回歸的效果越好 殘差圖 稱為相應(yīng)于點(diǎn)的殘差, 殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高. 殘差平方和 殘差平方和越小,模型的擬合效果越好 四、獨(dú)立性檢驗 1.獨(dú)立性檢驗 利用隨機(jī)變量(也可表示為)(其中為樣本容量)來判斷“兩個變量有關(guān)系”的方法稱為獨(dú)立性檢驗. 2.獨(dú)立性檢驗的一般步驟 (1)根據(jù)樣本數(shù)據(jù)列出列聯(lián)表; (2)計算隨機(jī)變量的觀測值k,查下表確定臨界值k0:
57、 (3)如果,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過;否則,就認(rèn)為在犯錯誤的概率不超過的前提下不能推斷“X與Y有關(guān)系”. (1)通常認(rèn)為時,樣本數(shù)據(jù)就沒有充分的證據(jù)顯示“X與Y有關(guān)系”. (2)獨(dú)立性檢驗得出的結(jié)論是帶有概率性質(zhì)的,只能說結(jié)論成立的概率有多大,而不能完全肯定一個結(jié)論,因此才出現(xiàn)了臨界值表,在分析問題時一定要注意這點(diǎn),不可對某個問題下確定性結(jié)論,否則就可能對統(tǒng)計計算的結(jié)果作出錯誤的解釋. (3)獨(dú)立性檢驗是對兩個變量有關(guān)系的可信程度的判斷,而不是對其是否有關(guān)系的判斷. 1.從總體為的一批零件中
58、使用簡單隨機(jī)抽樣抽取一個容量為40的樣本,若某個零件在第2次抽取時被抽到的可能性為1%,則 A.100 B.4000 C.101 D.4001 【答案】B 2.某中學(xué)進(jìn)行初中與高中各年級的期末考試,該校共有50個考場,每個考場有30個考生,每個考生的座位號按1~30號隨機(jī)編排,每個考場抽取座位號為18號考生的試卷進(jìn)行評分,這種抽樣方法是 A.簡單隨機(jī)抽樣 B.系統(tǒng)抽樣 C.分層抽樣 D.分組抽樣 【答案】B 【解析】如果將每個考場的考生的座位號按從小到大的順序排列,在50個考場中每個考場抽取座位號為18號的考生的試卷,即系統(tǒng)抽樣,故選B. 3.對兩個變量進(jìn)
59、行線性回歸分析,計算得到相關(guān)系數(shù),則下列說法中正確的是 A.與正相關(guān) B.與具有較強(qiáng)的線性相關(guān)關(guān)系 C.與幾乎不具有線性相關(guān)關(guān)系 D.與的線性相關(guān)關(guān)系還需進(jìn)一步確定 【答案】B 4.福利彩票“雙色球”中紅色球的號碼由編號為01,02,…,33的33個個體組成,某彩民利用下面的隨機(jī)數(shù)表選取6組數(shù)作為6個紅色球的編號,選取方法是從隨機(jī)數(shù)表第1行的第6列和第7列數(shù)字開始由左到右依次選取兩個數(shù)字,則選出來的第6個紅色球的編號為 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 57 24 55 06 88 77
60、04 74 47 67 21 76 33 50 25 83 92 12 06 76 A.23 B.09 C.17 D.02 【答案】D 【解析】從隨機(jī)數(shù)表第1行的第6列和第7列數(shù)字開始由左到右依次選取兩個數(shù)字,則選出的6個紅色球的編號依次為21,32,09,16,17,02,故選出的第6個紅色球的編號為02. 5.某疾病研究所想知道吸煙與患肺病是否有關(guān),于是隨機(jī)抽取1000名成年人調(diào)查是否吸煙及是否患有肺病,得到2×2列聯(lián)表,經(jīng)計算得,已知在假設(shè)吸煙與患肺病無關(guān)的前提條件下,,則該研究所可以 A.有95%以上的把握認(rèn)為“吸煙與患肺病有關(guān)” B.有95%以上的把握認(rèn)為“吸煙
61、與患肺病無關(guān)” C.有99%以上的把握認(rèn)為“吸煙與患肺病有關(guān)” D.有99%以上的把握認(rèn)為“吸煙與患肺病無關(guān)” 【答案】A 【解析】由獨(dú)立性檢驗的結(jié)論結(jié)合題意可知:有95%以上的把握認(rèn)為“吸煙與患肺病有關(guān)”.故選A. 6.某市疾病控制中心對某校高二學(xué)生進(jìn)行了某項健康調(diào)查,調(diào)查的方法是采取分層抽樣的方法抽取樣本.我校高二學(xué)生共有2000人,抽取了一個200人的樣本,其中男生103人,請問該校共有女生 A.970人 B.1030人 C.997人 D.206人 【答案】A 7.如圖是某賽季甲、乙兩名籃球運(yùn)動員每場比賽得分的莖葉圖,則甲、乙兩人這幾場比賽得分的中位數(shù)之和是
62、 A.51 B.58 C.61 D.62 【答案】D 【解析】由莖葉圖可知,甲的這幾場比賽得分的中位數(shù)為27,乙的這幾場比賽得分的中位數(shù)為35, 所以甲、乙兩人這幾場比賽得分的中位數(shù)之和是27+35=62. 8.已知一組數(shù)據(jù)3,5,7,x,10的平均數(shù)為6,則這組數(shù)據(jù)的方差為 A. B.6 C. D.5 【答案】C 【解析】由題意,得3+5+7+x+10=6×5,得x=5, 所以這組數(shù)據(jù)的方差為s2=(9+1+1+1+16)=. 9.采用系統(tǒng)抽樣方法從1000人中抽取50人做問卷調(diào)查,為此將他們隨機(jī)編號為1,2,…,1000,適當(dāng)分組后在第一組采用簡
63、單隨機(jī)抽樣的方法抽到的號碼為8.抽到的50人中,編號落入?yún)^(qū)間[1,400]的人做問卷A,編號落入?yún)^(qū)間[401,750]的人做問卷B,其余的人做問卷C,則抽到的人中,做問卷C的人數(shù)為 A.12 B.13 C.14 D.15 【答案】A 10.為了全面推進(jìn)素質(zhì)教育,教育部門對某省500所中小學(xué)進(jìn)行調(diào)研考評,考評分?jǐn)?shù)在80以上(包括80分)的授予“素質(zhì)教育先進(jìn)學(xué)校”稱號,考評統(tǒng)計結(jié)果按[50,60),[60,70),[70,80),[80,90),[90,100]繪制成如圖所示的頻率分布直方圖,則應(yīng)授予“素質(zhì)教育先進(jìn)學(xué)?!狈Q號的學(xué)校的個數(shù)為 A.175 B.145 C
64、.180 D.240 【答案】A 【解析】由頻率和為1可知x=0.1-(0.040+0.020+0.010+0.005)=0.025, 故應(yīng)授予“素質(zhì)教育先進(jìn)學(xué)?!狈Q號的學(xué)校有(0.025+0.010)×10×500=175(所). 11.某廠家為了解銷售轎車臺數(shù)與廣告宣傳費(fèi)之間的關(guān)系,得到如表所示的統(tǒng)計數(shù)據(jù)表:根據(jù)數(shù)據(jù)表可得回歸直線方程其中據(jù)此模型預(yù)測廣告費(fèi)用為9萬元時,銷售轎車臺數(shù)為 廣告費(fèi)用萬元) 2 3 4 5 6 銷售轎車臺數(shù)) 3 4 6 10 12 A.17 B.18 C.19 D.20 【答案】C 12.采用系統(tǒng)抽樣的方
65、法從800名學(xué)生中抽取50名學(xué)生進(jìn)行視力檢査.為此,將他們隨機(jī)編號為1,2,3,…,800,若在116號中隨機(jī)抽到的號碼數(shù)為7,則從3348這16個號碼數(shù)中應(yīng)抽取的號碼為________. 【答案】39 【解析】33?48應(yīng)在第3組中,故應(yīng)抽取的號碼為. 13.已知x1,x2,…,x6的標(biāo)準(zhǔn)差為10,則10x1-1,10x2-1,…,10x6-1的標(biāo)準(zhǔn)差是________.? 【答案】100 【解析】根據(jù)標(biāo)準(zhǔn)差的定義可得10x1-1,10x2-1,…,10x6-1的標(biāo)準(zhǔn)差是100. 14.《九章算術(shù)》第三章“衰分”中有如下問題:“今有甲持錢五百六十,乙持錢三百五十,丙持錢一百八十,
66、凡三人俱出關(guān),關(guān)稅百錢,欲以錢數(shù)多少衰出之,問各幾何?”其意為:“僅有甲帶了560錢,乙?guī)Я?50錢,丙帶了180錢,三人一起出關(guān),共需要交關(guān)稅100錢,依照錢的多少按比例出錢”,則丙應(yīng)出________錢(所得結(jié)果四舍五入,保留整數(shù)). 【答案】17 【解析】設(shè)丙應(yīng)出x錢,由題意可得,求解可得錢. 15.為了判斷高中二年級學(xué)生選修文科或理科是否與性別有關(guān),現(xiàn)隨機(jī)抽取50名學(xué)生,得到如下的2×2列聯(lián)表: 理科 文科 總計 男 13 10 23 女 7 20 27 總計 20 30 50 已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025,根據(jù)表中數(shù)據(jù),可得有________的把握認(rèn)為選修文科或理科與性別有關(guān). 【答案】95% 16.某市在每年的春節(jié)后,市政府都會發(fā)動公務(wù)員參與到植樹活動中去.林管部門在植樹前,為保證樹苗的質(zhì)量,都會在植樹前對樹苗進(jìn)行檢測.現(xiàn)從甲、乙兩種樹苗中各抽取了10株樹苗,量出的高度如下(單位:厘米). 甲:37,21,31,20,29,19,32,23,25,33; 乙:10,30,47,
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生主題班會尋找“專注”法寶課件
- XX科技人力資源調(diào)查與診斷課件
- 人應(yīng)該有所畏懼
- 混合運(yùn)算解決問題教學(xué)課件
- 習(xí)慣養(yǎng)成講座課件
- 黃河頌(教育精品)
- 應(yīng)用一元二次方程(二)新PPT通用課件
- 滬粵版《1.1希望你喜愛物理》ppt課件(教育精品)
- 華為公司隨機(jī)資料圖標(biāo)庫
- 煉鋼工藝流程PPT課件
- 民間美術(shù)1(教育精品)
- 《月球之謎》課件1
- 二級語文上冊 山里的桃花開得遲 課件 滬教
- 二級英語下冊 Unit 3 Lesson 18 what’s for lunch(3)課件 冀教(一起)
- 草蟲的村落 (2)(教育精品)